再版前害 


本书第一版受到出乎意料的 欢迎： 各兄弟院校广泛采用；发 
行20佘 万册； 获第一届国家级优秀教材奖.这应归功于时代的需 
要，也说明作者试图写出一本既有前苏联教本的系统严谨，又有 
美国书籍的生动活泼，体现我国教学经验，理论与应用兼备的教 
材的目标得到一定程度的实现. 

广大师生的热情反映和意见，写作时就存在的不少遗憾，陆 
续发现的一些不足甚至错误，18年来在教学和科研中讷些许心 
得，这些成了第二版修改的依据. 

本书的结构受到一致的肯定，这次未加更改，只是重写了过 
于薄弱的数字特征部分，因而增加一节，并恢复了初版时因篇幅 
考虑而删去的全书小结. 

增写了不少典型应用事例，补写上几个影响学科初期发展的 
名例，改写了一些平淡无味的实例，这些使本书的理论与应用更 
为均衡，更为尊重历史事实，也更准确地反映概率论这一学科目 
前在整个自然科学和社会科学中的重要地位.相信也增添了本书 
的趣味性. 

一 种分布就是一^数学模型.初版重视分布及它们之间联系 
的传统得到发扬.正式引入负二项分布与埃尔兰分布，使两个等 
待分布序列的对比更为明显.改动了一些例题与习题.这样一来， 
本书把分布按重要性分成 三类： 第一类三大分布有专门的节加以 
介绍；第二类包括十几种重要分布，在正文中指明其背景、性质 
以及它与其他分布的关系；第三类则多数在习题中出现.最后在 
附录一中汇总.关于多元分布，新版也较前重视. 

儿 个定理 的证明 被局部更动，多数为改善，少数为改正.增 


添了唯一的一个定理（移植自浅野、江島两位先生与作者合著的 
一 本日文书），用极其筒练的办法证明了重要的多元中心极限定 
理. 

习题是本书的重要组成部分.这次略作调整，基本题约占四 
分之三，与正文紧密配合，标有星号的题目对正文作了补充，双 
星号的是难题.为适应不同需要，配题较多，教学中选用约半数 
即可. 

以上是关系全局的一些较大变动，其他增删所在多是.定理、 
公式、图表的编号作了统一编排.关键词附上英文，重要数学家 
的名字也都标出原文，译名有些更动.希望通过这些修改能使原 
书的质量有所提高.预料书中仍会存在不少缺点与错误，欢迎广 
大师生批评、指正. 

修改后的第二版篇幅略有增加，如为学时所限，建议舍去相 
对独立的熵与信息一节和相当专深的最后两节. 

在我的概率论生涯中，得到郑绍濂、吴立德、陶宗英、汪嘉 
冈、何声武、卞国瑞、徐家鹄等师友的许多帮助，高尚华为本书 
的前后两版付出大量心血，缪铨生教授主持了第二版的审稿，在 
此一并致谢* 


李贤平 

1996年中秋 
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第一章事件与概率 


§ 1. 随机现象与统计规律性 

一、 随机现象 

概率论 (probability theory ) 是研究随机现象的数量规律的数 
学分支.为了说明什么是随机现象，让我们先来看一个例子.设 
某车间有200台车床，由于经常需要检修、测量、调换刀具、变 
换位置等种种原因，因此，即使在生产期间，各台车床还是时常 
需要停车.若每台车床有百分之六十的时间在开动，而每台车床 
开动时需要耗电1千瓦，问应供给这个车间多少电力才能保证此 
车间正常生产？ 

类似的例子在许多实际问题中出现，解决这类问题当然具有 
重要意义. 

显然，若供给这个车间200千瓦的电能则此车间便能正常生 
产.但这样做不合算，因为每台车床的开工率只有60%，也就足 
说，平均起来这个车间中同时在工作的车床只有120台，供给它 
们200千瓦的电能太多.供给120千瓦的电能 行吗？ 这又太少些， 
因为有时工作的车床数会超过台，若只供给〗20千瓦，则这 
时会出现因电力不足而使车床无法正常运转，那么到底供给多少 
才能既保证生产正常进行而又节约电力呢？ 

用概率论的方法能给这个问题以完满的解决，现在我们仅把 
结果列出，详细的解法以后再讲.计算表明，只要供给这个车间 
141千瓦的电就够了，虽然在这时也可能碰到因电力不足而不能 
正常生产的 情况. 但这种机会很少，它小于0.1%,即在8小时工 



作中一般只有半分钟会碰到这种情况，这显然影响不大.但节约 
出来的59千瓦电能却能用于许多別的用途. 

解决这个问题的关键在于要计算出某时刻同时工作着的车床 
数，但是由于某台车床在某时刻是否开工很难预先确定，这受到 
许多偶然因素的影响，即工作着的车床数是一个受许多偶然因素 
影响的量. 

原来，在自然界和人类社会中存在着两类不同的现象. 

当我们多次观察自然现象和社会现象后，会发现许多事情在 
一定的条件下必然会发生.例如在没有外右作用的条件下，作等 
速直线运动的物体必然继续作等速直线运动，•又如在海边生活时， 
水加热到100 C 时必然会沸腾等等.这种在一定条件下，必然会发 
生的事情称为必然 事件. 反之，那种在一定条件下，必然不会发 
生的事情就称为 不可能事件. 例如在不受外力作用的条件下，作 
等速直线运动的物体改变其等速直线运动状态是不可能的. 

从所举例子中看出，必然事件和不可能事件，虽然形式相反， 
但是两者的实质是相同的.必然事件的反面就是不可能事件，而 
不可能事件的反面就是必然事件. 

所有这种现象我们称之为 决定性现象， 它广泛地存在于自然 
现象和社会现 象中. 

但是在自然现象和社会现象中也还广泛存在着与决定性现象 
有着_质区别的另一类现象，上述车间供电问题就是一例. 

类似的例子还可以举出很多，例如用同一仪器多次测量同一 
物体的重量，所得结果彼此总是略有差异，这是由于诸如测量仪 
器受大气影响，观察者生理上或心理上的变化等等偶然因素引起 
的.同样地，同一门炮向同一目标发射多发同种炮弹，弹落点也 
不一样，因为炮弹制造时种种偶然因素对炮弹质量有影响，此外， 
炮筒位置的误差，天气条件的微小变化等等都影响弹落点.再如 
从某生产线上用同一种工艺生产出来的灯泡的寿命也有差异等 
等.总之，所举这些现象的一个共同的特点是：在基本条件不变 
« 2 * 



的情况下，一系列试验或观察会得到不同的结果.换句话说，就 
个别的试验或观察而言，它会时而出现这种结果，时而出现那种 
结果，呈现出一种偶然性.这种现象称为随机现象.对于随机现 
象通常关心的是在试验或观察中某个结果是否出现，这些结果称为 
随机事件，简称事件 ( event ). 例如过马路交叉口时可能遇上各种 
颜色的交通指挥灯，这是一个随机现象，而“遇到红灯”则是一个 
随机事件.以后我们用（〕等大写拉丁字母表示随机事件. 

二、频率稳定性 

正如恩格斯所指出的，在表面上是偶然性在起作用的地方，这 
种偶然性始终是受内部的隐蔽着的规律支配的，而问题只是在于 
发现这些规律. 

人们经过长期的实践发现，虽然个别随机事件在某次试验或 
观察中可以出现也可以不出现，但在大量试验中它却呈现出明显 
的规律性频率稳定性. 

对于随机事件若在#次试验中出现了《次，则称 

为随机事件 Z 在 W 次试验中出现的频率. 

下面是关于频率稳定性的几个有名例子.援引这类例子是因 
为它们不但具有一定的权威性，而且都是可以反复验证的. 

在掷一枚硬币时，既可能出现正面，也可能出现反面，预先 
作出确定的判断是不可能的，但是假如硬币均勻，直观上出现正 
面与出现反面的机会应该相等,即在大量试验中出现正面的频率， 
应接近于50%，为了验证这点，历史上曾有不少人做对这个试验， 
其结果如下页所示 ®. 

又如，在英语中某些字母出现的频率远远高于另外一些字母. 


①引自格涅坚科.概率论教程.高等教育出版社，第44页. 
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出现正面次数 

频 率 
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丰 

4040 

2048 

0*5069 

皮 
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12000 

6019 

0* 5016 

皮 

尔 

逊 

24000 

12012 

0- 5005 


在进行了更深入的研究之后，人们还发现各个字母被使用的频率 
相当稳定.例如，下面就是英文字母使用频率的一份统计表 ® .其 
他各种文字也都有着类似的规律. 


字母 

空格 

E 

丁 

0 

A 

N 

I 

R 

s 

频率 

0. 2 

0. 105 

0* 072 

0. 0654 

0. 063 

0. 059 

0. 055 

0 r 054 

a 

■ 

0. 052 

字母 

H 

D 

L 

C 

F 

U 

M 

P 

Y 

频率 

0, 047 

0* 035 

0*029 

0- 023 

0. 0225 

0, 0225 

0. 021 

0. 0175 

0. 012 

字母 

W 

G 

B 

V 

K 

X 

J 

Q 

Z 

频率 

0- 012 

0. 011 

0.0105 

0. 008 

0- 003 

0. 002 

0. 001 

0. 001 

0. 001 



近年来对汉语的统计研究有了很大的发展.关于汉字的使用 
频率已有初步统计资料，对汉语常用词也作了一些统计研究.特 
别是结合汉字输入方案等的研制，正在对汉字的结构作深入的统 

计分析.这些研究对实现汉字信息处理自 
动化无疑具有重要的意义. 

另一个验证频率稳定性的著名试验是 
由英国生物统计学家髙尔顿 ( Galton ) 设计 
的.它的试验模型如图1 所示. 

自上端放入一小球，任其自由下落，在 
下落过程中当小球碰到钉子时，从左边落 
下与从右边落下的机会相等.碰到下一排 
钉子时又是如此.最后落入底板中的某一 
格子.因此，任意放入一球，则此球落入 


___ 

似:“ 





图1高尔顿板 


①引自 L- Brillouin* Science and Information Theory, New York ， 1956. 


















哪 • "•个 格子，预先难以确定.但是实验证明，如放入大量小球，则 
其最后所呈现的曲线，儿乎总是一样的.也就是说，小球落入各 
个格子的频率十分稳定.这个试验模型称为高尔顿板.试验中呈 
现出来的规律性，在学习第五章极限定理之后，就会有更深刻的 
理解. 

同样，如果多次测量同一物体，其结果虽略有差异，但当测 
量次数增加时，就会越来越清楚地呈现出一些规 律性： 测量值的 
平均值在某固定常数附近波动，诸测量值在此常数两旁的分布呈 
现某种对称性.义如在射击的例子中，当射击次数不多时，炮弹 
的弹落点似乎是前后左右杂乱无章，看不出什么明显的规律；但 
当射击次数增加时，弹落点的分布就会呈现出一定的规律 性：如 
弹落点关于目标的分布略呈对称性，偏离目标远的弹落点比偏离 
目标近的弹落点少等等.其他如灯泡寿命等，在进行多次观察或 
试验后，也都可以发现类似的规律性. 

曰常生活中也不乏有趣的例子，例如衣服和用具总在同样部 
位以相似的方式破损，下雨时地面各处总是差不多同时淋湿等等, 
读者只要多注意观察，就不难发现许多关于频率稳定性的有说服 
力的实例. 

上述神种事实表明，随机现象有其偶然性的 一面， 也有其必 
然性的 一面. 这种必然性表现为大量试验中随机事件出现的频率 
的稳定性，即一个随机事件出现的频率常在某个固定的常数附近 
摆动，这种规律性我们称之为统计规律性.频率的稳萣_明随 
机事件发生的可能性大小是随机事件本身固有的、不随人们意志 
而改变的一种客观属性，因此可以对它进行度量. / 

对于一个随机事件 A ， 用一个数 /> C 4) 来表示该事件发生的 
可能性大小，这个数户（乂）就称为随机事件 Z 的槪率 
( probability ). 因此概率度量了随机事件发生的可能性的大小. 

对于随机现象，只讨论它可能出现什么结果，价值不大，而 
指出各神结果出现的可能性的大小则具有很大意义.有了概率的 

• 5 • 



概念就使我们能对随机现象进行定量研究，由此建 立了一 个新的 
数学分支——概率论. 


三、频率与概率 


既然概率 PU ) 度量了随机事件 V 4 发生的可能性大小，可以 

预料，在 W 次重复试验中， 若尸 ( A ) 较大，则频率 F〆 /!) =券也 

较大.反之若 PM ) 很小，则仏 04) 也很小，而且概率尸 M ) 应 
与频率有许多相似的性质.以下我们先对频率的性质进行一番考 
察. 

首先，频率具有非负性 

F n (A)^0 (L 1.1) 


其次，对于必然发生的事件，在 AH 欠试验中应出现 iV 次.若 
以 D 记必然事件，则应有 


F N {{2) — 1 


( 1 . 1 . 2 ) 


还有，若 A 及 B 是两个不会同时发生的随机事件，以 A + S 

表示 A 或£至少出现其一这个事件，则应有 

F n { A -\- B ) = F n ( A )-\- F n ( B ) (1. 1.3) 


这个性质称为频率的可加性. 

当然还可以列出频率的许多性质，但上述三个性质是最基本 
的.例如，“不可能事件在 w 次试验中出现的频率为0”，“任何随 
机事件在#次试验中出现的频率不大于1”，“对于有限个两两不 
会同时发生的随机事件也有频率可加性”，这些性质都可以由 
(1.1.1), (1.1.2) 及（1.1_3)推出. 

最后，根据上述频率稳定性的讨论似乎可以提出这样的猜想， 
即当#足够大时〜 C 4) 与 PC 4) 应充分 接近. 这一点有很大的启 
发性，在历史上它一直是概率论研究的一个重大课题.以后我们 
将会看到，在很一般的条件下，这个结论的确成立，但同时还须 
对问题的提法进一步明确化. 



频率与概率的上述关系有时还提供了求某事件概率的一种手 
段，即当 W 足够大时，用它的频率来作为概率的近似值.以后我 
们将会看到，这种做法大有好处. 

四、概率论简史 

概率论是一门研究随机现象数量规律的学科，一般把1654年 
作为概率论诞生的一年.这年中，法国数学家巴斯卡与费马就机 
会博弈中的一些问题作了通信讨论；后来惠更斯也加入研究.在 
这些研究中建立了概率论的一些基本概念，如事件、概率、数学 
期望等. 

其后，随着生产实践的发展，特别是在射击、保险、测量等 
工作中提出的一些概率问题，促使人们在概率论的极限定理等方 
面进行深入研究，起初主要对伯努利试验概型进行研究，而后则 
推广到更为一般的场合.这个时期先后对概率论作出重要贡献的 
数学家有伯努利、拉普拉斯、泊松和高斯. 

极限定理的研究在18世纪和19世纪整整200年中成了概率 
论研究的中心课题.在本世纪初，由于新的更有力的数学方法的 
引入，这些古典问题得到了较好解决，这当中俄罗斯彼得堡学派 
起了主导作用. 

虽然概率论历史悠久，但是它的严格的数学基础的建立以及 
理论研究和实际应用的极大发展却主要是本世纪的事情. 

由于物理学（如统计物理）、生物学以及工程技术（如自动电 
话、无线电技术）发展的推动，概率论得到了飞速的发展.理论 
课题不断扩大与深入，概率论的思想渗入各个学科成了近代科学 
发展的明显的特征之一. 

由于各个数学分支的发展与互相渗透，概率论的严格的数学 
基础被建立起来，古典间题得到了解决，新的概念和工具不断出 
现，概率论成了数学的一个活跃分支. 

概率论大大地扩大了它的应用 范围. 特别在最近几十年中，概 



率论的方法被引入备个工程技术学科和社会学科.目前，概率论 
在近代物理，无线电与自动控制，工厂产品的质量管理，医药和 
农业试验，金融保险业等等方面都找到了重要应用，这些实际耑 
要也有力地推动了概率论的新发展，有些还形成了边缘学科（如 
信息论、排队论、可靠性理论等). 

在这个时期内，由于生物学和农业试验的推动，数理统计学 
(mathematical statistics ) 也获得了很大发展，它以概率论为理论 

基础，又为概率论应用提供了有力的工具，两者互相推动，迅速 
发展.而概率论本身的研究则转入以随机过程为中心课题，取得 
了许多理论上和应用上都有重要价值的结果. 


§2. 样本空间与事件 


一、 样本空间 

从本节开始，我们将逐步引进概率论的基本概念.样本空间 
与事件是最基本的两个概念. 

对随机现象的研究必然要联系到对客观的事物进行“调査”、 
“观察”或“实验”，以后我们统称之 为试验 （ trial ), 并假定这种 
“试验”可以在相同条件下重复进行. 

我们感兴趣的是试验的结果.例如掷一次硬币，我们关心的 
是出现正面或出现反面，这是两个可能出现的结果.假如我们考 
察的是掷两次硬币的试验，则可能出现的结果有（正，正），（正， 
反），（反，正），（反，反）四种；如果掷三次硬币，则结果还要 
复杂，但还是可以把它们描述出来.总之，为了研究随机试验，首 
先需要知道这个试验可能岀现的结果.这些结果称为 样本点，一 
般用⑴表示 * 样本点全体 构成样本空间 (sample space ) ，用 X 2 表 

示.在具体问题中，给定样本空间是描述随机现象的第一步. 
下面 举一搜 例子. 

[例 1] 在研究英文字母使用情况时，把样本空间选为 ■- 
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{ 空格， A , B . …， 是适宜的，这个样本空间只有有限个样本 
点，是比较简单的样本空间. 

[例 2] 观察 •小时 中落在地球上某一区域的粒子数，可能 
的结果一定是非负整数，而且很难指定一个数作为它的上界，这 
样，可以把样本空间取为0=(0, 1, 2,…}.这个样本空间含有 
无穷多个样本点，但这些样本点可以依照某种次序排列出来，以 
后我们将称它的点数为可列个. 

[例 3] i 寸论莱地区的气温时，我们自然把样本空间取为 
O — (—…，…），或 [ a ，6]. 这个样本空间包含有无穷多个 

样本点，它们充满一个区间，不是一个可列集. 

[例 4] 考察地震震源时，叮以把样本点取为（■^ _ y ， 2)，其 
中 x 表示震源的经度，表示讳度，2表示深度.这时，样本空间 
是三维空间中某一 区域. 

从以 L 例+可以看出，随着问题不同，样本空间可以相当简 
单，也可以相当复杂. 

在今后讨论中，经常把样本空间认为是预先给定的.当然对 
于一个实际问题或一个随机现象，如何用一个恰沒的样本空间来 
描述它也很值得研究.但是在概率论的研究中，一般都假定样本 
空间是给定的.这是必要的抽象，这种抽象使我们能更好地把握 
住随机现象的本质，而且得到的结果能广泛地应用.事实上，• 
个样本空间可以概括 各神实 际内容很不相同的问题 ：例如 只包含 
两个样本点的样本空间既能作为掷硬币出现正、反面的模型，也 
能用于产品检验中出现“好品”及“废品”，又能用于气象中 “ K 
雨”与“+下_”，以及公用事业排队现象中“有人排队” V “无 
人排队”等等.尽管问题的实际内容如此不同，但有时却能归结 
为相同的概率模型.我们后面常以摸球等作为例子也是由于这个 
原闵，它能使问题的本质更为突出. 



二、事件 


有了样本空间的概念，就可以定义事件.我们还是从考察一 
个例子开始. 

[例 5] 口袋中装有4只白球和2只黑球，我们考虑依次从 
中摸出两球所可能出现的事件.若对球进行编号，4只白球分别编 
为1，2, 3, 4号，2只黑球编为5, 6号.如果用数对 G , >) 表 

示第一次摸得 ，号 球，第二次摸得号球，则可能出现的结果是 

(1, 2), (1， 3)， （]， 4)， （1， 5)， （1， 6) 


(2， 1)， （2, 3)， （2， 4)， （2， 5>， （2， 6) 


(3， 1)， （3， 2), (3， 4)， （3， 5)， （3， 6) (•) 

(4, 1)， （4， 2)， （4， 3)， （4， 5), (4， 6) 

(5， 1)， （5， 2)， （5, 3), (5， 4)， （5， 6) 

(6, ])， （6， 2)， （6， 3)， （6, 4)， （6， 5) 

把这30个结果作为样本点，则构成了样本空间.在这个问题 
中，这些样本点是我们感兴趣的事件；但是我们也可以研究下面 
另外一些事件： 

A t 第一次摸出 黑球； 

B ： 第二次摸出黑球； 

C ： 第一次及第二次都摸出黑球. 

后面这些事件与前面那些事件的不同处在于这些事件是可以 

分解的，例如为了 A 出现必须而且只须下列样本点之一出现： 

(5， 1)， （5， 2)， （5, 3)， （5， 4)， （5, 6) 


(6, 1)， （6， 2), (6, 3)， （6, 4)， （6, 5) 

前面的30个事件由单个样本点 构成； 后面这三个事件，每一 
个事件都是由若干个样本点构成的，总之，它们都是样本点的某 
个集合. 

所谓给定一个点的集合心是指对于任何一 个点％ 都可以确 
定它是不是属于* S . 如果是，则记为 a 6 &如果不是， 
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则记为按照这种定义，单个点也是一个点集.习惯上还约定 
不包含任何点的集合也是一个点集，称为空集，记为 0. 

今后，我们 把事件 定义为样本点的某个集合，称某事件发生 
当且仅当它所包含的某一个样本点出现. 

因此，虽然试验的全部可能结果在试验前就很明确，但是只 
有到了试验之后，才能确定某一特定的事件是否发生， 

我们把样本空间 D 也作为一个事件，因为在每次试验中必然 
出现中的某个样本点，也即 D 必然发生，所以常称 D 为 必然事 
件. 类似地，我们把空集0也作为一个事件，它在每次试验中都 
不会发生，称为 不可能事件. 

必然事件在试验中必然发生.相反地，不可能事件在任何 
试验中不可能发生，必然事件与不可能事件可以说不是随机事件， 
但为了今后研究的方便，我们还是把必然事件与不可能事件作为 
随机事件的两个极端情形来统-•处理. 

三、事件的运算 

在一个样本空间中显然可以定义不止一个事件.概率论的重 
要研究课题之一是希望从简单事件的概率推算出复杂的事件的概 
率.在实际生活中，往往要求我们同时考察几个在同样条件下的 
事件以及它们之间的联系.详细地分析事件之间的关系，不仅帮 
助我们更深刻地认识事件的本质，而旦可以大大简化一些复杂事 
件的概率计算. 

下面就讨论事件间的关系及事件的运算，先讨论两个事件 A 
与方 之间的关系. 

若 Z 中的每一个样本点都包含在方中，则记为 ACIB 或方二) 
儿并称 A 是的特款， 亦 称事件忍包含了事件 A ， 这时事件 A 

发生必然导致事件方发生.例如若以 d 记“来到呼叫不超过5 

个”，以£记“来到呼叫不超过6个”，则 A (^ B . 显然对任何事件 
儿必有 G 二 )/1 二 )0. 
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如果与 B 1 DA 同时成立，则称/4与忍等价或称4等于 
B , 记为 A = 等价的两个事件同时发生，因此可看作是一样的. 

对于事件 Z ， 由所有不包含在4中的样本点所组成的事件称 
为4 的逆事件， 或称4 的对立事件， 记为万，及表示 M 不发生 • 
例如若以 A 表示 “来 到呼叫不超过5个”，则万表示“来到呼叫超 
过5个显然，若 Z 是 Z 的对立事件，则 A 也是万的对立事件, 
即 A = A . 必然事件与不可能 赛件互 为对立事件. 

其次，对于事件 Z 及淇件石，定义两个新 事件： 

用 zns 或 zb 矣示所有同时属于 a 及 b 的样本点的集合， 
称它为 A 与#的交， 事件表示事件 A 与事件5同时发生. 

用 AUB 表示至少属于 A 或 B 中的一个的所有样本点的集 
合，称它为4 与办的并 ，事件 /I US 表示事件 A 或事件或它们 
二 t 发生，也即表示事件 Z 与 藝件 5至少发生一个. 

若 AB = 0， 则表示4与 B 不可能同时发生，称 A 与》互不 
相容. 样本点是互不相容的. 

以后，对于互不相容取件 A 与我们称它们的并为和，并 
记作 A 十凡 

用 A - B 表示包含在 vl 中而不包含在 B 中的样本点全体，称 
之为 A 与 B 的差， 事件 A-B 表示 事件/ 发生而事件 B 不发生， 

显然 A —方=乂7?. 

在进行事件的运算时，关于它们的顺序作如下 约定： 先进行 
3|的运算，再进行$的运算，最后才进行#或 g 的运算. 

用上面的记号_以把对立事件之间的关系 I 述如下 = 
13, Af ] A ^0, 这也可以作为对立事件的定义.显然万 = « n — A . 

我们用例5来说明这些关系 . r ) 中30种可能结果就是样本 
点全体，它们构成必然事件仏 

A 记第一次摸得黑球/则它由第5行及第6行的10个样本点 
构成； 这时3表示第一次摸得白球，它由第一行至第四行的20个 
样本点构成.显然/与互不相容，而且 
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万记第二次摸得黑球，它由下列10个样本点 构成： 

( I ， 5)， （1， 6)， （2， 5)， （2， 6)， （3， 5) 

(3，6)，（4，「)），（4，6)，（5，6)，（6， 5) 

事件 ZUB 表示第一次或第二次中至少有一次摸得黑球，它 
包含下列18个样 本点： 

(1， 5)， （1， 6)， （2, 5)， （2， 6)， （3， 5)， （3， 6) 

(4， 5)， （4， 6)， （5， 1)， （5， 2)， （5， 3)， （5， 4) 

(5， 6)， （6， 1)， （6, 2)， （6， 3)， （6， 4)， （6， 5) 

事件表示两次都摸得黑球，它由下列两个样本点 构成: 
(5, 6)，（6, 5), 这 是/与 B 共同包含的样本点.因此 C = 凡 

事件乂一5表示第一次摸得黑球而第二次摸出白球，包含了 
(5， 1)， （5， 2)， （5， 3)， （5， 4)， （6， 1)， （6， 2), (6， 3)， 

(6, 4) 等8个样本点. 

有时用平面上某正方形中的图形来表示事件间的关系或运算 
较为直观，这种表示法称为文 （ Verm ) 图. 

事件 <0, A ， A ， A [ jB , AB , 召在图2中分别以阴影表 

出.不难理解，相应于、4的图形完全包含在万的图 形中 ； A 
和 B 互不相容，则相应于4和5的图形不相交. 

不难把上面定义推广到多个事件的场合. 

例如，对于《个事件 A ， …， 用 AUAU - U/H 

U 八表示 A ! ， yl ；； ， …， 中至少发生一个，称为八，^， … ，凡 

t= 1 

的并，特别当為，…， 人两两 互不相容时，并称为和，记作 

n 

+1 + …+ 或 X A •用 4八，或 h A 表示 A ，，…， 

* ? 1 
卜 l 

九同时发生等等. 

对于可列个事件的场合，我们定义 

[jAi = lim U A t , f| A r lim (]A, 

i = I /j—► o ^ ~ 1 / —^ ) "kx) /■==! 


* 
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AUB ab A-B 


图 2 事件运算 

熟悉集合论的读者或许早就发现，事件间的关系及运算与集 
合论中或布尔 ( Book ) 代数中集合的关系及运算是完全相似的，而 
且这个相似在建立概率论的严格数学基础时非常重要.不过，我 
们应该注意另一点，就是要学会用概率论的语言来解释这些关系 
及运算，并且会用这些运算关系来表示一些事件. ‘ 

[例 6] 若 A ， B ， C 是三个事件，则 

(1) A 发生而5与 (：都 不发生可以表 示为: ABC 或 A —B — C 
或 (5 UO ; 

(2) A 与5都发生而 C 不发生可以表 示为： ABC ^ AB-C 

^AB~ABCi 

(3) 所有这三个事件都发生可以表 示为： ABC ； 

(4) 这三个事件恰好发生一个可以表 示为： ABC + ABC 十 

ABCi 

(5) 这三个事件恰好发生两个可以表 示为： ABC + ABC^r 
ABCi 

(6) 这三个事件中至少发生一个可以表示为： AUBUC 或 
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十 ABC + ABC-^r ABC + ABC + ABC + ABC ； 

对于事件的运算成立下列关系式，它们的证明留给读者. 

(1) 交换律： A\JB = B \ JA , AB^BAi 

(2) 结 合律： { A \ JB )\ JC = A \ J ( B \ JC ),{ AB)C = A ( BC )^ 

(3) 分 配律： （ v 4 UB ) DC =4 C ； UBC ， 

( AP \ B ) \ JC^(A UC)fl ( BUC ) 

(4) 德莫根 （De Morgan ) 定理： 

对于 《 个事件，甚至对于可列个事件，德莫根定理也成立. 

四、有限样本空间 


我们先考虑只有有限个样本点的样本空间，这种样本空间称 
为有 限样本空间. 这是最简单的样本空间，研究它有助于深入研 
究更为复杂的样本空间. 

若是有限样本空间，其样本点为瓦，£ 2 ，… ，丑 n , 在这种 
场合可以把 D 的任何子集都当作事件.在这种样本空间中引进概 
率，只要对每个样本 点瓦， 给定一个数与它对应，此数称 为瓦的 
概率，并记之为 P (五 ,）， 它是非负的，而且满足 

尸 （瓦） + P (五 2 ) +…+尸(丑„) = 1 


这样，我们对样本点定义了概率，用它来度量每个样本点出现的 
可能性的大小.由此出发，我们不难定义更为一般的事件的概率. 

定义 1 . 2 . 1 任何事件 A 的概率 P ( A ) 是 A 中各样本点的概 
率之和. 


按照这个定义，显然有 P ⑴）=1，0<尸(4)<1. 

如在例5中，若定义每个样本点出现的概率均为^ (这相当 


于假定各个球外形完全一样，并且摸球是随机的，各个球被摸到 


的机会均等），则得 




10 

而， 


P ( B ) 




10 

30 ' 


P ( C ) 






30 ' 


P ( A [ JB ) 


18 

30 


, P ( A - B ) 





鲁 
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我们将在下一节研究一种特殊的有限样本空间. 

把上面做法推广到有可列个样本点的样本空间是不难的，这 
种空间 称为离散样本空间. 但是当把上面做法推广到不可列个样 
本点的场合，则会遇到实质性的困难，对于这种一般场合的讨论， 
以后将逐渐展开. 


§3. 古典概型 

— 、樓型与计算公式 

在讨论一般随机现象之前，我们先讨论一类最简单的随机现 
象.这种随机现象具有下列两个 特征： 

(1) 在试验中它的全部可能结果只有有限个，譬如为》个，记 
为 E 、， ，…， E n ， 而 a 这些事件是两两互不相 容的； 

(2) 事件&，£ 2 ，…，的发生或出现是等可能的，.即它们 
发生的概率都一样. 

这类随机现象在概率论发展初期即被注意，许多最初的概率 
论结果也是对它作出的，-般把这类随机现象的数学模型称为古 
典概型. 古典概型在概率论中占有相当重要的地位，一方面，由 
于它简单，对它的讨论有助于直观地理解概率论的许多基本概念， 
因此，我们常从讨论古典概型开始引入新的 概念； 另一方面，古 
典概型概率的计算在产品质量抽样检查等实际问题以及理论物理 
的研究中都有重要应用. 

显然，古典概型是有限样本空间的…种特例.可以选 X 3 二{私, 
E 2 ，…， E „} 作为样本空间 ， 而且此时应有 

F ( £：丨 ） =: P ( £ 2 ) 二 …= P (幻 =丄 

n 

对于任何事件 .4, 它总可以表示为样本点之和，例如 
十^^ +…+瓦，因此由事件概率的定义 

4 

)4-P(K / V4 〜… +PC/1,) 

1 2 m 
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( 1 . 3 - 1 ) 


所以在古典概型中，事件 Z 的概率是一个分数，其分母是样 

本点的总数《，而分子是事件 A 中所包含的样本点的个数 m , 由 

于£ 4 ，£,"•••， £, m 的出现必导致 A 的出现，即它们的出 现对」 

的出现“有利 ”， 因此习惯上常称瓦 i ，凡 2 ，…， 瓦是乂的“有利 

1 6 ^ 


场合”，这样， 


P ( A ) 


A 的有利场合的数目 


n 


(L 3, 2) 


样本点总数 

法国数学家拉普拉斯 （ Laplace ) 在1812年把上式作为率的 


一般定义.现在通常称它为概率的古典定义，因为它只适用于古 
典概型场合. 

古典概型有着多方面应用，产品抽样检査就是其中之一. 

产品抽样检査的技术，在各个生产部门中被广泛采用.许多 
大工厂产量很高，每天生产的产品数以万计，对这些产品的质量 
如果要进行全面的逐件检验通常是不可能的或是不经济的；另外， 
在有些情况下，产品的检验方法带有破坏性（如电灯泡寿命检验 
和棉纱强度试验），这样，最适宜的检验方法是采用抽样检査，即 
从产品中随机地抽出若干件来检验，并根据检验结果来判断整批 
产品的质量. 


关于产品的质量，可以有多种多样的衡量标准，例如可能要 
考虑产品的某种形状或尺寸，或把产品分成若干等级，我们先考 
虑最简单的情形，即把产品分成合格品（好品）与次品（废品）两 
个类型的场合. 

假如产品的好坏从外形上看不出来，而且我们又是随机抽样, 
那么任何一件产品被抽到的可能性都一样，这正是古典概型. 

有一个口袋，内装 a 只黑球，6只白球，它们除颜色不同外， 
外形完全一样（以后若非特别声明，均作此假定).这样一来，当 
我们从袋子中任意摸出一球时，这 a +6 只球中的任意一只被摸到 
的可能性都一样. 


4 


參 
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若把黑球作为废品，白球作为好品，则这个摸球模型就可以 
描述产品抽样.假如产品分为更多等级，例如一等品，二等品，三 
等品，等外品等等，则可用装有多种颜色的球的口袋的摸球模型 


来描述. 

这种模型化的方法能使问题更清楚，更容易看出其随机性本 
质而不致被个别情况下的具体属性所蒙蔽.不仅如此，这种抽象 
化的模型带有普遍性，它还可以描述许多别的具体问题，从而有 
着多方面应用.例如种水稻地块的调查，某种疾病的抽查等都能 
用这个模型. 

事实上，古典概型的大部分问题都能形象化地用摸球模型来 
描述.以后我们经常研究摸球模型，意义即在于此. 

前节例5及其有关概率的计算是古典概型的一个例子，但并 
不是所有古典概型的事件的概率计算都这么容易.事实上，古典 
概型中许多概率的计算相当困难而富有技巧.计算的要点是给定 


样本点，并计算它的总数，而后再计算有利场合的数目.在这些 
计算中，经常要用到一些排列与组合公式. 


二、基本的组合分析公式 

1. 全部组合分析公式的推导基于下列两条 原理： 

乘法原理 若进行 A 过程有 A 种方法，进行戍过程有 
种方法，则进行戌过程后再接着进行鳥过程共有 Wl X /2 2 种方法 
(图 3). ’ 

加法原理 若进行 A 过程有 A 种方法，进行 A 过程有〜 

种方法，假定4过程与次过程是并行的，则进行过程4或过程 
A 2 的方法共有 n ,+ n 2 种（图 4). 

显然这二条原理可以拓广到多个过程的场合. 

2. 排列： 

从包含有《个元素的总体中取出 r 个来进行排列，这时既要 

考虑到取出的元素也要顾及其取出顺序. 
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这种排列可分为 两类： 第一种是有放回的选取，这时每次选 
取都是在全体元素中进行，同一元素可被重复选中；另一种是不 
放回选取，这时一个元素一旦被取出便立刻从总体中除去，因此 
每个元素至多被选中一次，在后一种情况，必有 

(1) 在有放回选取中，从《个元素中取出 r 个元素进行排列， 
这种排列称为有重复的排列，其总数共有/种. 

(2) 在不放回选取中，从个元素中取出 r 个元素进行排列， 
其总数为 

A r n ~~n (n 一 1) in 一 2) ••- (n 一 rH~ 1) 

这种排列称为选排列.特别当时，称为全排列. 

(3) «个元素的全排列数为 I 

P n = n in — 1) ".3 • 2 • l=nl < 


3. 组合： 

(1) 从 n 个元素中取出 r 个元素而不考虑其顺序，称为组合， 
其总数为 


Cn = 


A r n n (n 一 1) •** (衫一 r+1) 


n\ 


« 


♦ 


r\ in — r )! 


这里 I 是二项展开式的系数 ， （㈣ 


n 


2 


<2) 若 n + n + …+/% 



a r b n 


9 


把打个不同的元素分成々个部分， 



㈣ 




19 


9 


第一部分 n 个，第二部分「2个， . % k 部分^ 个， 则不同的分 

法有 




(L 3,3) 


种，上式中的数称为多项系数，因为它是（;^+:?: 2 +… + A )" 展开 
式中的系数，当々= 2时，即为组合数. 

(3) 若 w 个元素中有叫个带足标“1”，《2个带足标 “2”， . 

个带足标 “ k ” ， 且〜+〜 +… + w *= w ， 从这 W 个元素中取出 r 

个，使得带有足标的元素有个而 n + r 2 + 〜 
+ = 这时不同取法的总数为 


1 n l 1 


’ n 2 _、 

* # • 


r x J 


、 r 2 1 


^ r k 


(1.3.4) 


这里当然要求 


(4) 从〃个元素中有重复地取 r 个，不计顺序，则不同的取法 


有 


( n -\~? — — 1 

^ r I 


种，这个数称为有重复组合数. 

4. 一 些常用等式： 

把排列公式推广到 r 是正整数而； 2 是任意实数 x 的场合，有 
时是需要的，这时记 




(工一 1) (x — 2) 


• « * 


(x~r+ 1 ) 


同样定义 


\ 广 f 





1) (: r—2) … (x—r+1) 


及0! 


1, 


0 



对于正整数〃，若「>〃，则 


0 
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这样- 来，二项系数有性质 






k 


( ~ 1 ) 


/ 


+是 一 1 

k 



由于 


故 


(1+x) 


2 


0 


r 
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2 W 


利用幂级数乘法又可以证明 
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a\[ b\ 


nj \ 01 



I 


特别地 



(1. 3*6) 


n — \ 


+ … + 


n 


0 


2n 


即 

I n \ 2 { ( n \ 2 L / 2 叫 n ”、 

^ n +•••+ = (1- 3* 7) 

0/ 1/ nj n 

三、 概率直接计算的例子 

[例 1] 一部四册的文集按任意次序放到书架上去，问各册 
自右向左或自左向右恰成1，2，3，4的顺序的概率是多少？ 

[解]若以 a ， b ， c，d 分别表示自左向右排列的书的册号，则 
上述文集放置的方式可与向量 U ， c ， d ) 建 立一一 对应，因为 
a ， b ， “ J 取值于1, 2, 3, 4，因此这种向量的总数相当于4个 
元素的全排列数4! =24,由于文集按“任意的”次序放到书架上 
去，因此这24种排列中出现任意一种的可能性都相同，这是古典 
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概型概率，其有利场合有2种，即自左向右或自右向左成1，2, 3, 
4 顺序，因此所求概率为盖 

[例 2] 有 10 个电阻，其电阻值分别为 m ， 2n, …， ion, 从 
中取出三个，要求取出的三个电阻， 一 个小于 5fl, — 个等于50, 
另一个大于 5Q, 问取一次就能达到要求的概率. 

[解]把从10个电阻中取出3个的各种可能取法作为样本 

10 / 4 W 1 W 

点全体，这是古典概型，其总数为7，有利场合为 t :, 

6 ^ \ 1 / \ 1 / \ 1 / 

故所求概率为 



[例 3] 甲有 n + 1 个硬币，乙有《个硬币，双方投掷之后进 
行比较，求甲掷出的正面数比乙掷出的正面数多的概率. 

[解]这个问题初看非经繁复计算难求答案，但是若充分利 
用它特有的对称性并选择适当的样本空间，则能迅速求解. 

若以 A 记“甲的正面数>乙的正面数”，则表示“甲的正面 
数< 乙的正面数”，但是考虑到甲比乙多一个硬币这一特殊情况, 
MA 又表示“甲的反面数>乙的反面数再由硬币的对称性，显 
然尸 G4) ^ P ( A ). 因此我们构造只有两个样本点的样本空间 

M， ：?}，便可轻而易举地写出答案尸 (A) -y. 

[例 4] 设有 n 个球，每个球都能以同样的概率&落到 JV 个 

格子的每 一 个格子中，试求： 

(1) 某指定的《个格子中各有一个球的概率; 

(2) 任何《个格子中各有一个球的概率. 

[解]这是一个古典概型问题，由于每个球可落入 iV 个格子 
中的任一个，所以《个球在 W 个格子中的分布相当于从 iV 个元 
素中选取《个进行有重复的排列，故共有 AT 种可能分布. 
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在第一个问题中，有利场合相当于《个球在那指定的《个格 
子中全排列，总数为《!，因而所求概率为 



在第二个问题中， n 个格子可以任意，即可以从 iV 个格子中 
任意选出 n 个来，这种选法共有种，对于每种选定的〃个格 

\ n / 

子，有利场合正如第一个问题一样为 n !， 故所求概率为 


L N tt N n (N—rOl 

这个例子是古典概型中一个很典型的问题，不少实际问题可 
以归结为它. 

例如，若把球解释为粒子，把格子解释为相空间中的小区域， 
则这个问题便相应于统计物理学中的 Maxwell - Boltzmann 统计， 

概率论历史上有一个颇为有名的问题：要求参加某次集会的 
个人中没有两个人生日相同的概率.若把《个人看作上面问题 
中的 n 个球，而把一年的365天作为格子，则 JV = 365, 这时尸 2 就 
给出所求的概率.例如当 n = 40 时，尸 2 = 0.109,这个概率已经相 
当小；而当《 = 50时，尸 2 = 0.03; 进一步当 w = 55时，尸2之值只 
有0.01，这实在是出乎意料地小.总之，投球问题中球相遇的概 
率比预料的大得多，这种意外在研究随机现象中时常遇见，也算 
是随机现象的特性之一吧！ . 

四、抽签与顺序无关 

抽签是人为地引进随机性的一个最简单的例子，不单在体育 
比赛中广泛采用，而且在日常生活中也时常可见.关于抽签所体 
现的公平性，即结果虽然不同但机会却是均等的这种概念，只有 
通过概率论才能清楚阐明. 

进一步可以说，抽签是随机化方法的一种特例，随机化方法 




23 * 



在抽样调查和试验设计中都有广泛应用，是人类可以主动利用随 
机性的一个例证. 

下面的摸球问题值得读者仔细推敲. 

[例 5] 口袋中有 a 只黑球， A 只白球，它们除颜色不同外，其 
他方面没有差别，现在把球随机地一只只摸岀来，求第々次摸出的 
一只球是黑球的概率 

[第一种解法]把 a 只黑球及6只白球都看作是不同的（例 
如设想把它们进行编号），若把摸出的球依次放在排列成一直线的 
a + b 个位置上，则可能的排列法相当于把 a +6 个元素进行全排 
列，总数为 ( a +^)! ,把它们作为样本点全体.有利场合数为 aX 
( a + b - l )}, 这是因为第欠摸得黑球有 a 种取法，而另外 (« + 
々一 1) 次摸球相当于《+6—1只球进行全排列，有种 
构成法，故所求概率为 




a X (a-\-b—l) ] a 
(<2 +A) ! CL + 办 


这个结果与@关！ 

细想一下，发觉这个结果与我们平常的生活经验是一致 
的.例如在体育比赛中进行抽签，对各队机会均等，与抽签的先 
后次序无关. 


[第二种解法]把 a 只黑球看作是没有区别的，把6只白球 
也看作是没有区别的.仍把摸出的球依次放在排列成一直线的 a 
+办个位置上，因若把 a 只黑球的位置固定下来则其他位置必然 


是放白球，而黑球的位置可以有种放法，以这种放法作为 

, d I 


样本点.这时有利场合数为 a ^ b ~ l ) ,这是由于第々次摸得黑 

a —\ 

球，这个位置必须放黑球,剩下的黑球可以在 a +彡 一 1个位置上任 
取 a — 1个位置，因此共有^+6了^种放法.所以所求概率为 

\ a — \ ! 


/ a~\rh~ 1 1 

M — I a —l I — a 
’严 — |^丑「 = 

i CL I 

两种不同的解法答案相同！ 

注意考察一下两种解法的不同，就会发现主要在于选取的样 
本空间不同.在前一种解法中把球看作是“有个性的”，而在后一 
种解法中则对同色球不加区别，因此在第一种解法中要顾及各黑 
球间及各白球间的顾序而用排列，第二种解法则不注意顺序而用 
组合，但最后还是得出了相同的答案. 

这种情况的产生并不奇怪，这说明对于同一随机现象，可以 
用不同的模型来描述，只要方法正确，结论总是一致的.在这个 
例子中，第二种解法中的每一个样本点是由第一种解法中的 d • 
b\ 个样本点合并而成的. 

这个例子还告诉我们，在计算样本点总数及有利场合数时，必 
须对同-个确定的样本空间考虑，因此其中一个考虑顺序，另一 
个也必须考虑顺序，否则结果一定不正确. 

既然同-个随机现象可用不同的样本空间来描述，因此对同 
一 个概率也常常有多种不同的求法，我们应逐步训练自己能采用 
最简便的方法解题，为此熟悉同一问题的多种不同解法是重要的. 

例如，对例5就存在着多种不同的解法，上面提供的只是比 
较自然的两种.注意到在这两种解法中，我们对不同的々用的是同 
一 个样本空间，也就是说，我们构造了一个可以描述 a +6 次摸球 
的样本空间，并利用它一举解决了 “第丨次摸得黑 
球”这一概率的计算.假如允许对不同的 A 用不同的样本空间，则 
我们完全可以构造 •个只 包含前々次试验，甚至只包含第々次试 
验的样本空间，这时也能求得有关概率.特别是选用最后一种样 
本空间简直马上可以看出正确答案，不过这种做法对初学者或许 
不那么容易理解. 

I 
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五、二项分布与超几何分布 


产品抽样检验有两类，即有放回抽样与不放回抽样.在有放 
回抽样中，被抽出的产品检验后仍放回产品堆中，再抽第二次，因 
此这件产品以后仍然可能再次被抽到.更常用的是第二种方法，即 
不放回的抽样方法，这时被抽到的产品不再放回，因而以后不会 
再被抽到.与此相应的，我们的摸球模型也假定为有放回与不放 
回摸球两种，这两个情形得到的结果是不同的. 

下面是古典概型概率计算中一个典型问题，它有着多方面应 
用，特别在产品检验方面起很大作用. 

[例 6] 如果某批产品中有 a 件次品6件好品，我们采用有 
放回及不放回抽样方式从中抽 n 件产品，问正好有纟件是次品的 
概率各是多少？ 

所求的概率显然与抽样方式有关，下面我们分别来讨论 • 
[有放回抽样场合]把 a + 6 件产品进行编号，有放回抽《 
次，把可能的重复排列全体作为样本点，总数为 U +6)”， 其中有 

利场合（即次品正好出现々次）的数目是 UjaV ' 故所求概率 

为 ' — 




a k b n k 



(a+by 


f n) 



i b 



[a^bj 

\ o, ~\~b\ 



(1.3.8) 


〜是二项式展开式的一般项，上述概率称为 

二项分布 （分布一词的意义将在第三章阐明).关于二项分布更一 
般的讨论在以后各章陆续进行. 

[不放回抽样场合]从件产品中取出”件产品的可能 

/ i a \ I h 

组合全体作为样本点，总数为(了卜有利场合数为“|(”_」， 
故所求概率为 
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,kj \ n —— 、々 / 

hk — ^—-~ ( 1 . 3 . 9 ) 

a -to I 
\ n I 

这个概率称为超几何分布. 

从直观上看，当产品总数很大而抽样数不大时，采用有放回 
抽样与采用不放回抽样，差别应该不大. 

事实上，因为 


h k 


k 




k 


Ar k 


Ai _ 

k ! (n — k ) ! / n \ 


+b 


A ： 




* 


k 


a k b n 


(a-\-by 


At # 

a k b n ~ k 

— 

(a+b) n 


而当々比小得多 ， w —々比 6 小得多时: 


^ Ar k 




b n 


h 


A 


^1 


( a + d ) 


因此 


k 


A 


n 


+ 厶 


hk^bi 


在实际工作中，抽样一般都采用不放回方式，因此计算次品 
数为 A 的概率时应该用超几何分布，但 ( U 3. 9) 的数值计算较繁 
复.若产品数甚大而抽样数不太大，则可利用上述性质，计算二 


项分布作为近似值，这时有许多专门表格可査，这样可以大大节 


省计算工怍量. 


利用上例结果，马上可以计算下列 概率： 若一批产品共有 w 
件，其中有次品 M ( M < N ) 件， 今抽取《件，则其中恰有 m 件 

次品的概率是 





\ M\ 


\ m i 


! J\J — \ 



N \ 




O^n^N ^ O^m^M 

_ A/ 


(L 3. 10) 


这是超几何分布的另-种常见形式. 

学到这里，细心的读者可能会发觉这样一个矛盾，在我们前 
面讨论中都假定产品中的次品数已知，然后根据它来计算种种概 
率，而在实际问题中，情况恰恰相反，次品数是未知的，并且正 
是我们希望通过抽样检验来确定的. 

这个矛盾可通过下面办法来解决. 

不难理解，抽出来的样本的质量情况在某种程度上反映了整 
批产品的质量情况，例如，如果整批产品中次品很多，则抽査的 
样本中含有次品的可能性就相当大；反之，若产品中极少次品，则 
从中抽查一、两件产品而得到次品的可能性就很小，因而样本中 
所含次品数的多少就为我们估计整批产品中的次品数提供了某种 
根据.例如为了确定某批产品的次品率，通常采用的方法是从这 
批产品中抽若干件产品作为样本来检验，并用样本的次品率来估 
计整批产品的次品率.关于这个课题的研究，构成了数理统计的 
重要内容. 

由于抽样带有随机性，因而不同的柚样可能得到不同的结果， 
所以我们有必要对各种结果出现的可能性大小进行讨论，这为我 
们根据样本情况推断整批产品情况提供了理论依据，这神研兗是 
概率论的任务.从这里也看出，概率论与数理统计有着很密切的 
联系. 

[例 7] 从某鱼池中捕得1200条鱼，做了红色的记号之后再 
放回池中，经过适当的时间后，再从池中捕1000条鱼，数出其中 
有红色记号的鱼的数目，共有100条，试估计鱼池中共有多少条 
鱼？ 

[解]设池中共有 n 条鱼，《未知，是我们要估计的.更一般 . 
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地，设第一次捕得的鱼有 A 条（针对本例，〜= 1200)，第 二次捕 
得 r 条 （针对本例， r =1000), 而其中有记号的有々条（针对本例， 


k — 100 乂 

现在，在第二次捕鱼中有々条有记号鱼的概率按超几何分布 

(1.3.10) 给出： 


pk M = 



k 




因为实 际上在 r 条鱼中有々条有记号，因此我们求 n 使得上式概 
率达到最大，并把这个数值作为池中鱼数的估计. 

由于 

p k (n) (n — n l ) (n — r) n 2 一 nn l — 

- = - = ---- = D 

/ (n—n l -r-\-k) n n 2 —— nrix—nr^rnk 

因此当时，户>1，而当衫々〉;^时，户<1，即户 *(”） 当 n 

时是《的增函数，而当时是 w 的减函数 ， 所以当打等 

于 



时，勿 （《) 达到最大值.这样我们把作为鱼池中鱼总数 w 的 
估计量. 


在这个例 子中: 


0 


A 


1200 X 1000 

100 


12000 


这里解题的基本思路是把 概率九 ( n ) 看作未知参数〃的函 
数，再通过求其最大值而得到 n 的估计，这是数理统计中著名的 
最大似然估计法. 


六、槪率的基本性质 

古典概型中，若样本空间为 {E lt £ 2 , £„}，分别以 
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n(A),n(B) t n(A\jB) 及 n (AB) 记事件5, AU 召及 所 

包含的样本点数，则显然成立公式 

niA\JB) =n{A) J rn( y B') 一 niA^) 

两边除以《，即得概率的等式 

P(A\JB)=P(A)-\-P(B)-P(AB) 

以后将会看到，这是普遍成立的一个等式/如果这里的 A 与 
B 不相容，即45=0，立刻得到 

PiA J rB ^ = P { A )-\- PiB ) (1.3.11) 

不难把这个结果推广到有限个事件的场合，即若，…, 
是 m 个两两互不相容的事件，则 

尸 （ A +次十 …+丄）=尸04 1 )+尸 M 2 ) + …+尸（疋） 

(1. 3. 12) 

这个结论可借助 （1.3.11) 用归纳法证明. 

系 PdA) = l-P(A). (1.3.13) 

[证]由于 = 所以 

P{Q)=PiA-\-A) = P{A) J tPCA) = \ 

因此 

PiA)^l-P(A) 

关系式 （1.3.13) 很简单，意义也很明确，但相当有用，它 
为计算某些事件的概率提供了很大方便. 

[例 8] (德 • 梅尔问题）一颗骰子投4次至少得到一个六点 
与两 P 骰子投24次至少得到一个双六，这两件事中哪一件有更多 
的机会遇到？ 

[解]以 A 表示一颗骰子投4次至少得到一个六点这一事 
件，为求 PC 4)， 在这种场合最方便的方法是利用 （1.3.13) 式先求 
PU ) ，这时 A 表示投一颗骰子4次都没有出现六点,因此不难得出 

P(A) =|^ 

6 

从而得到 
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p , = P { A ) =1— ( 音 j =0.5177 

若以 B 表示两颗骰子投 24 次至少得到一个双六这一事件， 
则用同样的方法可以求得 


p 2 = P ( B ) =1- ^ =0.4914 

这样一来，我们知道前者的机会大于 i ，而后者的机会小于 

这个问题在概率论发展史上颇有名气，因为它是德•梅尔向 
巴斯卡 ( Pascal ) 提出的问题之 一. 正是这些问题导致了巴斯卡的 
研究和他与费马 （ Fermat ) 的著名通信.前已指出，他们的研究 
标志着概率论的诞生. 

[例 9] 一口袋中装有 N -1 只黑球#>只白球^次从袋中 
随机地摸出一球，并换入一只黑球，这样 i 续下去， 问第々 次摸球 
时摸到^ 黑球的概率是多少？ 


[解]若以4表示第*次摸到黑球这一事件，则3表示第是 
次摸到白球.现在计算户 ( A ). 

因为袋中只有一只白球，而每次摸出球总是换入黑球，故为 
了在第 A 次摸到白球，则前面的々一 1次一定不能摸到白球.因此 


A 等价于下列 事件： 在前摸出黑球而第 
白球 ， 这一 事件的概率为 


这样 


( W — 1广 1 • 1 




N 


/ 


P ( A )=^1- P ( A ) =1 — 


*-1 


1 -及 


I 



N 


公式 (1.3.13) 的应用使这个题目很快获得解决，假如直接 
计算尸 G 4) 则困难得多.从公式 （1.3.13) 中容易看出，只要 P 04) 
或 PC 5) 中的任何一个知道了，则可以求得另一个.在不同问題 
中，有的求尸 （ A ) 容易，求 P (万）困难；有的正好相反.利用 
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(1.3.13)， 我们就可以先求容易的一个，再去求另一个. 

从古典概型的概率研究中，我们发现概率有下面三个基本性 

质： 

( i ) 对于任何事件 P ( A ) >0； 

( ii ) P ( O ) =1； 

( iii ) 若 d 2 , …，两两互不相容，则 

尸 ( A +/12+ …十九 ） = P ( A 1 )+ i P ( A 2) + *“+ i ：> ( A «) 

第一个性质称为概率的非负性，第二个性质称为概率的规范 
性，第三个性质称为概率的（有限）可加性 • 

§ 4•几何槪率 

一、 例子与计算公式 

4 

在古典概型中利用等可能性的概念，成功地计算了某一类问 
题的概率；不过，古典概型要求可能场合的总数必须有限，因此 
历史上有不少人企图把这种做法推广到有无限多结果而又有某种 
等可能性的场合.这类问题一般可以通过几何方法来求解. 
先从几个简单的例子开始. 

[例 1] 某人午觉醒来，发觉表停了，他打开收音机，想听电 

台报时，求他等待的时间短于10分钟的概率 • 

[例 2] 如果在一个5万平方公里的海域里有表面积达40 

平方公里的大陆架贮藏着石油，假如在这海域里随意选定一点钻 

探，问钻到石油的概率是多少？ 

[例 3] 在400毫升自来水中有一个大肠杆菌，今从中随机取 
出2毫升水样放到显微镜下观察，求发现大肠杆菌的概率. 

一种相当自然的答案是认为例1所求的概率等于例2中钻 

到石油的概率等于^，而例3所求的概率等于在求这些概率 

时，我们事实上是利用了几何的方法，并假定了某种等可能性. 
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在例 1 中，因为电台每小时报时一次，我们自然认为这个人 
打幵收音机时处于两次报时之间，例如 （13 : 00, 14 : 00)，而且 
取各点的可能性一样，要遇到等待时间短于10分钟，只有当他打 
开收音机的时间正好处于13 : 50至14 : 00之间才有可能，相应 

的概率是黑= I . 

在例 2中，由于选点的随机性，可以认为该海域中各点被选 
中的可能性是-样的，因而所求概率自然认为等于贮油海域的面 

积与整个海域面积之比，即等于 • 

同样地，例3中由于取水样的随机性，所求概率等于水样的 

体积与总体积之比 

总之，在这类问题中，试验的可能结果是某区域中的 •个 
点.这个区域可以是一维的，也可以是二维的，还可以 fe 三维的， 
甚至可以是《维的，这时不管是可能结果全体或是我们所感兴趣 
的结果都是无限的.因而等可能性是通过下列方式来賦予意 义的： 
落在某区域#的概率与区域 g 的测度（长度、面积、体积等等）成 
正比并且与其位置及形状无关. 

因此，若以 八记 “在区域中随机地取一点，而该点落在区 
域貧中”这一事件，则其概率定义为 


P(A ^ K 的测度 A 

据此定义，则上述诸例之解是明显的.下面 
再举一个例子. 

[例 4] (会面问题）两人相约7点到8 
点在某地会面，先到者等候另一人20分钟， 
过时就可离去，试求这两人能会面的概率. 

[解] 以心 y 分别表示两人到达时刻， 
则会面的充要条件为 


( 1 . 4 ‘ 1 ) 



I 工一 : y 1<20 
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这 是一个几何概率问题，可能的结果全体是边长为 60 的正 方形里 
的点，能会面的点的区域用阴影标出（图 5). 所求概率为 

60 2 -40 2 5 

/) =-=： 

p 60 2 9 


二、蒲丰问埋 


1777年法国科学家蒲丰提出了下列著名问题，这是几何概率 
的一个早期例子. 

[投针问题]平面上画着一些平行线，它们之间的距离都等 
于《，向此平面任投一长度为/ (/<^)的针，试求此针与任一平 
行线相交的概率. 

[解]以 x 表示针的中点到最近的一条平行线的距离，史表 
示针与平行线的交角.针与平行线的位置关系见图 6. 

显然有音，以 G 表示边长为专■及 7 ^的长方 

形.为使针与平行线相交，必须 jsiriA 满足这个关系式的区 
域记为在图6中用阴影表出，所求的概率为 




图 


g 



2 


/ sin ^> 


G 的面积 


a% 


Ka 


( L 4. 2) 


由于最后的答案与 n 有关，因此不少人想利用它来计算 it 的 
数值，其方法是投针 JV 次，计算针与线相交的次数〃，再以频率 




34 • 



值&作 为概率之值代入（1.4.2)，求得 



21N 

an 


(1.4.3) 


下表 ® 给出了这些试验的有关资料（把 a 折算为 1). 


实验者 

i 

1 

年份 

针长 

投掷次数 

相交次数 

n 的实验值 

Wolf 

1850 

0,8 

5000 

2532 

3, 1596 

Smith 

1855 

0_ 6 

3204 

1218- 5 

3. 1554 

De Morgan ^ C* 

1860 

1.0 

600 

382 - 5 

3, 137 

Fox 

1884 

0. 75 

1030 

489 

3. 1595 

Lazzerini 

1901 

_ 

0,83 

3408 

1808 

3. 1415929 

Reina 

1925 

0_ 5419 

2520 

丨 859 

3. 1795 


值得注意的是这里采用的 方法： 建立一个概率模型，它与某 
些我们感兴趣的量——这里是常数 w ——有关，然后设计适当的 
随机试验，并通过这个试验的结果来确定这些量. 

现在，随着计算机的发展，已按照上述思路建立起一类新的 
方法，称蒙特卡罗 ( Monte - Carlo ) 方法，并取得广泛应用. 


三、贝特朗 （ Bertrand ) 奇论 

几何概率在现代概率概念的发展中曾经起过重大作用.19世 
纪时，不少人相信，只要找到适当的等可能性描述， 就可以给概 
率问题以唯一的解答，然而有人却构造出这样的例子，它包含着 
几种似乎都同样有理但却互相矛盾的答案，下面就是一个著名的 
例子. 

[贝特朗奇论]在半径为1的圆内随机地取一条弦，问其长 
超过该圆内接等边三角形的边长 VT 的概率等于多少？ 


QD 弓 I 自 Gridgeman , N, T- Geometric probability and the number it. Scripta Math 
ematica, 25 (I960), 183 —J95. 
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这是一个几何概率问题，但是基于对术语“随机地”的含义 
的不同解释，这个问题却存在多神不同答案，下面是其中的三种. 

[解法一]任何弦交圆周两点，不失一般性，先固定其中一 
点于圆周上，以此点为顶点作一等边三角形，显然只有落入此三 
角形内的弦才满足要求，这种弦的另一端跑过的弧长为整个圆周 

的+，故所求概率等于+ (见图7 ( a )). 



(a) (b) (c) 

图 7 

[解法二]弦长只跟它与圆心的距离有关，而与方向无关， 
因此可以假定它垂直于某一直径.当且仅当它与圆心的距离小于 

+时，其长才大于 v " T ， 因此所求概率为 | (见图 7( b )). 

[解法三]弦被其中点唯一确定，当且仅当其中点属于半径 
为" I ■的同心圆内时，弦长大于 vT ， 此小圆面积为大圆面积的+， 

故所求概率等于 | (见图 7( c )). 

同一问题有三种不同的答案，细究其原因，发现是在取弦时 
采用不同的等可能性假定.在第一种解法中，假定端点在圆周上 
均匀分布，在第二种解法中则假定弦的中点在直径上均匀分布，而 
在第三种解法中又假定弦的中点在圆内均匀分布.这三种答案是 
针对三种不同的随机试验，对于各自的随机试验而言，它们都是 
正确的. 

因此在使用术语“随机”、“等可能”、“均匀分布”等时，应 
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明确指明其含义；这又因试验而异. 

1899年贝特朗在巴黎出版《概率论》，书中对几何概率提出 r 
批评，并以生动的实例引起大家的注意.这种善意的批评，推动 
了概率论的发展. 

由于采用等可能性来定义概率有这种困难，因此后来就选择 
另外的途径，即在定义概率这一基本概念时只指明概率应具有的 
基本性质，而把具体概率的给定放在一边.这样做的好处是能针 
对不同的随机试验给定适当的概率. 

与概率的频率解释及古典概型一样，几何概率的研究对于我 
们了解应要求概率具有哪些基本性质是很有帮助的. 

四、几何概率基本性质 


几何概率的定义及计算与几何图形的测度密切相关，因此所 
考虑的事件应是某种可定义测度的集合.这类集合的并、交也还 
应该是事件，甚至对它们的可列次并、交也应有这个要求.例如 
考察在（0， 1) 中投一个点的随机试验，若以 A 记该点落入 



I )中这个事件，而以凡记该点落入 [ 

乃=1，2，…则 




oo 

A = 2 ^" 

rt=s 1 

如果假定所投的点落入某区间的概率等于该区间的长度，则 
PCA ) - 而 P ( A „) = 这时有 

\ 

oo 

P ( A ) = ^ P ( A n ) 

n — \ 

这里我们遇到了事件及概率的可列运算. 

综上所述，几何概率应具有如下 性质： 

( i ) 对任何事件 

( ii ) 尸⑴ ） ==1; 




37 ♦ 



( iii ) 若 4 2 , …两两互不相容，则 

D oo 

P ( S 戍卜 2 P ( A ) (1.4.4) 

1 « = 1 

前两个性质与古典型概率相同， （1.4.4) 则要求对可列个两两互 
不相容事件成立，这性质称为 可列可加性. 

§ 5.概率空间 

— 、走向槪率论公理化结构 

到本世纪初，概率论的各个领域已经得到了大量的成果，而 
且人们对概率论在其他基础学科和工程技术上的应用也出现了越 
来越大的兴趣.但是直到那时为止，关于概率论的一些基本概念 
——例如事件、概率等 —— 却没有明确的定义.这是一个很大的 
矛盾，这个矛盾不仅可能导致贝特朗奇论那样的怪现象产生，而 
且也使许多人对概率的客观含义，甚至概率论结论的可应用性都 
产生了怀疑.因此可以说，到那时为止，概率论作为一个数学分 
支来说，还缺乏严格的理论基础，这就大大妨碍了它的进一步发 
展. 

在概率论发展早期，所研究的随机现象比较简单，大部分可 
以归入古典概型.对这种模型，概率的计算可以通过某种等可能 
性的假设进行，其结果也有相当明确的解释.这种成功使得人们 
试图通过给定某种等可能性来定义概率.于是，由拉普拉斯给出 
的概率的古典定义在整个19世纪被人们广泛 接受. 但是，这种定 
义的局限性很快也暴露了出来，它既要求试验的可能结果总数有 
限，又要求某种等可能性，所以它的适用范围有限.当把这个结 
果推广到有无限多种可能结果的场合.例如几何概率时，不但适 
用范围仍然有限，而且还出现了新问题.总之，对一般的随机现 
象明确地定义概率及其他基本概念，在那时成了一个突出的问题 • 

解决这个问题的时机也在不断成熟.首先是通过对概率论的 
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两个最基本概念 一一 事件与概率的长期研究，发觉事件的运算与 
集合的运算完全相似，概率与测度有相同性质，这个事实随着当 
时在实变函数论中关于勒贝格 ( Lebesgue ) 测度和积分的研究以 
及一般柚象测度和积分理论的发展而日益明确起来. 

另外，19世纪末以来，数学的各个分支广泛流行着一股公理 
化潮流，这个流派主张把最基本的假定公理化，其他结论则由它 
们经过演绎导出. 


在这种背景下，1933年，前苏联数学家科尔莫戈罗夫 （ A . H . 
Ko ； nMoropoB> 提出了概率论公理化结构，这个结构综合了前人成 

果，明确定义了基本概念，使概率论成为严谨的数学分支，对近 
几十年来概率论的迅速发展起了积极作用.科尔莫戈罗夫的这个 
理论已被普遍接受，本书的各部分就是在这个结构下展开的. 


二、事件域 


在公理化结构中，事件不是最基本的概念，它通过更基本的 
概念——样本点来定义. 样本 点相应于随机试验的结果，我们已 
在前三节中进行过不少描述.在古典概型中，它们是可能结果全 
体，被用来定义一般的 事件. 在几何概率中，它们相应于区域中 
的点，也被用来定义一般的事件.以后，我们把样本点看作抽 
象的点，它们的全体 构成样本空间 

正如§2中所做的那样，我们把事件 Z 定义为的一个子 
集，它包含若干样本点，事件4发生当且仅当 A 所包含的样本点 
中有一个发生. 

一般并不把的一切子集都作为事件，因为这将对给定概率 
带来困难，譬如在几何概率中，若把不可测集也作为事件，将带 
来不可克服的困难. 

另一方面，又必须把问题中感兴趣的事件都包括进来.例如 
若 A 是事件，则应要求只也是事件 ？ 若乂与 S 是事件，则 
及 A 万也应是 事件. 当样本空间打由无限多个点构成时 - 在几 


I 


« 
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何概率中就是如此 --- 显然还得考虑可列个事件的并与交.此外， 
把 D 及0作为事件有很大方便. 

总之，我们若把事件的全体记为，，它是由^的一些子集构 
成的集类.而且为了使讨论便于进行，还得对^加上某些 限制: 
( i ) 

Gi ) 若 ae ，， 则 

o 

( iii ) 若九 6 牙，72 = 1，2，…则 U A 61* 

n ^ I 

一 般地，称空间 D 上满足上述三个要求的集类为 域， 亦称江 代 

数. 

若，为 ( T 域，则由 （ i ) 及 （ ii ) 可得 

0 €災 

此外，若戍6災，》= 1，2，…则 

OO H m > 

f ] A n = \ jA n ^ 

n—l n~l 

\Ja„~ U A U … U At U 0 U 0 … 6 , 

w— 1 

^ a = a n 次 n … n 八 rm 门仏 “ 6 ， 

rt 二 1 

定义 1. S . 1 若， - 是由样本空间 D 的-呰子集构成的一个 
a 域，则称它为 事件域 (event field ) ，，中的元素称为 事件， D 称 
为必然 事件， 0称为不可能 事件. 

值得指出，按照这种定义，样本点并不一定是事件. 

下面我们来举一些例子. 

[例1 ] 分 = { 0 ， <0 } ， 不难验证 W 是一个域，这时只 

有必然事件 D 与不可能事件0是事件. 

[例 2] ，= {0, / I , ,4, D }. 这时，也是一个 C 7 域，<0, 

A , A , 0是事件. 

[例 3] 0 = {^ i ，**•» w ,,}， 茨由 >0的一切子集构成，这时 

，是--个有限的集合，共有 2" 个元素，不难验证，貧" 是-个 <7域. 

• 40 • 



[例 4] 对于 一 般的/2，若.梦由 D 的一切子集构成，可以 
验证，7是-个 CT 域. 

从上面几个例子中看到，事件域可以很简单，也可以选得十 
分复杂，这就需要我们根据问题的不同要求来选择适当的事件域. 

下面 证明： 若给定 D 的一个非空集类岁，必存在唯一的一个 
•0 中的 J 域 m (沒)，具有如下两个性质： （1) 包含 琢； （2) 若有 
其他 a 域包含沒，则必包含 m (沒 ) .m (溪）称为包含劣的最小 
a 域，亦称由沒产生的^域. 

免证明必存在包含@的 a 域，显然由的一切子集构成的集 
类包含了务，由例4知此集类是…个 a 域，因此至少存在中的 
一个 a 域 m , 有 mZ ) 現 

现在只要取 D 中一切包含&的 a 域之交作为 m (沒)，则它是 
具有上述两个性质的〃域.这点留给读者自行验证， 

下面介绍两个非常有用的^域. 

[一维博雷尔 （ Bord ) 点集]以后我们将以 R 1 记数直线或 
实数全体，并称由一切形为 la . b ) 的有界间构成的集 
类所产生的 c 域为一维博雷尔^域，记之兔称淡的集为 

一维博雷尔点集. 

若工，>表示任意实数，由于 



(x » y) z = [: r ， y) ― {oc } 

I I 【 ■ 

U ，： y 」=ix j y) -h {y} 

( ，， _y ] 二 Lr ， 夕 ） + [y] — {x} 

因此潘 ， 中包含一切开区间，闭区实数，以 
及由它们经可^出的集合.这是相当大的一个 
集类，足够把实际问题中感兴趣的点集都包括在内. 

[« 维博雷尔点集]以记 n 维欧几里得 ( Euclid ) 空间，可 
以类似地定义 n 维博雷尔点集，它们是由一切 n 维矩形产牛.的《 




维波雷尔 a 域.中的集合，也可以把 R ” 中我们感兴趣的点集 
都包括在内. 


三、概率 

在公理化结构中，概率是针对事件定义的，即对应于事件域 
茨"中的每一个元素 A 有一个实数尸 （ A ) 与之对应，一般把这种 
从集合到实数的映照称为集合函数.因此，概率是定义在事件域 
#上的一个集合函数.此外，在公理化结构中只规定概率应满足 
的性质，而不具体给出它的计算公式或计算方法. 

概率应有什么性 质呢？ 

因为概率通过频率稳定性与随机试验相眹系，因此我们自然 
想到概率应有与频率类似的 性质. 关于频率的性质，我们已在§ 1 
中总结为非负性，规范性以及有限可加性. 

在古典概型中，概率是通过有利场合数与可能结果总数之比 
来定义的，它同样具有这三个性质. 

在几何概率中，情况也类似，但有一点不同，就是它要求对 
可列个不相容事件之和有可加性，即可列可加性. 

I 

在一般场合，处理可列个事件之和是完全必要的，因此保留 
这种可列可加性要求看来是合理的. 

综上所述，我们如下定义概率. 

定义 1.5. 2定义在事件域^上的一个集合函数尸称为概 

率，如果它满足如下三个 条件： 

( i ) jP ( A ) ^ 0,对 一 切 A € ; 

( ii ) 尸⑼=1; 

( iii ) 若 A 6 H = 1,2,…且两两互不相容，则 

[>^ 00 

p (2 成) = 2 P(A ,) (1.5.1) 

1 = 1 f — 1 

性质 （ iii ) 称为可列可加性或完全可加性. 

利用概率的基本性质 （ i ), ( ii )，（ iii ) 可以推出概率的另外一 
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些重要性质. 

性质1不可能事件的概率为0,即尸 (0) =0. 

[证明]因为 

D D + •“ 

所以 

P (O) (W +P ( 0 ) + … 

因此 _P (0) ~0. 

性质 2 概率具有有限可加性. 即 若凡八=0 G »), 则 

尸十…+ 儿）= P ( A } ) + 尸（/4 2 ) + …+ P ( A „) 


(1.5.2) 

[证明]因为 

凡 + 十…十 =為 + 4。+ … - h 0 H ■■… 

由可列可加性及性质1 

尸 （4 + 4 + …+ 疋） = PCAO 4-尸 （ A 2 ) + …+ P { A n ) 
性质 3对任何事件 A 有 

PCA ) = 1 - P ( A ) (1. 5. 3) 

[证明]因故 

1 = P ( O ) = P(A U A ) = P ( A ) + P ( A ) 

性质 4 如果 A 二^，则 

P(A - B ) - P ( A ) - P ( B ) (1.5.4) 

[证明]因为当 AZ ^ B 时 M 5 U 04 — 厶），又 B 门 （4 
~ B ) = 0，故 P 04) = P ( B ) + PiA - 石），移项即得 结论. 

推论 1 如果 

由此即知，对任意事件有户 M ) <1,再注意到概率的 
非负性，所以成立 

0 < P ( A ) < 1 (1.5.5) 

性质5 尸 （A U = P { A ) + P ( B ) ― P ( AB ). (1. 5. 6) 
[证明]因4 U B = Z U (方 一 A 6)， 而且 Z n (B - AB ) 
= 0 y 故尸 (A u B ) - P { A ) +PCB — AS ), 又 3 BC ： 方， 于是由 
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性质 4 得到 

P{A [j B ) = P ( A ) 4 - PCB ) - P ( AB ) 

公式 （1.5.6) 称 为概率的加法公式， 在古典概型场合，我们 
曾直接加以证明，如今则作为可加性的直接推论，说明在一般场 
合也成立.由它可得如下 推论： 

推论2 (布尔不等式） 

P(A U B )^ P ( A ) + P ( B ) (1.5.7) 

推论 3 ( Bonferroni 不等式） 

P ( AB ) > P ( A ) -f P { B ) 1 (1.5.8) 

利用归纳法不难把这两个不等式推广到 《 个事件的场合. 

P ( A , U 4 U … U A ) < P(AO 4 PM 2 ) + …+ P ( A n ) 

P { A , A Z - A n ) ^ 尸 ( A ) + P ( A 2 ) + … + PU „) - (n - 1) 

性质 6 ( — 般加法公式）若 v 4 i ， A 2 ， …， 儿为 w 个事件， 

则 ' 

尸 （A U 小 U … U 2尸(及） — S 尸(為為） 

j 二 K … d i<tj 

i 1 ，…， n 

+ S 尸(八為儿）+…+ (~ 1，-〒(从…疋） 

i < j〈k 

(1.5. 9) 

公式 （1.5.9) 可以用数学归纳法证明，留给读者作为习题. 
当然，概率还有其他性质，不过上述列出的各条是最重要的. 
它们是以后讨论中经常要用到的基本结果，务必牢记. 

值得提醒的是概率的这些重要性质的推导实质上只用到非负 
性、规范性和有限可加性. 

[概率计算的公式法]利用上面推导的公式来作概率计算， 
常能使解题思路清晰，计算便捷. 

[例 5] 某城有 W 辆卡车，车牌号从1到有一个外地人 
到该城去，把遇到的 n 辆车子的牌号抄下（可能重复抄到某些车 
牌号），求抄到的最大号码正好为々的概率 CKk<NX 
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[解]可以看怍古典概型问题，即设每辆卡车被遇到的机会 
相同.若以八记抄到的最大号码为々这一事件，又以艮记抄到 
的最大号码不超过（这一事件，则明显有山 = B k -，而且 
B k Z ) 代…所以由性质4知 P ( A k ) = P { B k ) - 尸(艮- 4) ，而由直 

接计算可得 P (私）=$，因此最后得到 


P ( A k ) 






(k — 
N n 


1) 


这种方法曾在第二次世界大战中被盟军用来估计敌方的军火 
生产能力，从被击毁的战车上的出厂号码推测其生产批量，得到 
相当精确的有用情报. 


[例 6] (匹配问题）某人写好《封信，又写好《只信封， 
然后在黑暗中把每封信放入一只信封中，试求至少有一封信放对 
的概率. 

[解] 若以在 记第〗封信与信封符合，则所求事件为 A U 
A 2 u … UA ， 所以可以用一般加法公式，不难求得 p (4) = 


(^ — 1) ! 




n 


華 


1 


n 


, P ( A t Aj ) 




(n — 2 )J 


n 


_ 


n(n _ 1) 


，尸 （4 AA ) 




n(n 一 1)(” 一 2) 


，…， PCAK ,) 


n 


■ 


因此 


P(A, U A 2 [j 


« _ 


U Aj 


n 


n 


n 
2 ) 


n(n — 1) 


n 


n (rz — l)(/i — 2) 


• * • 


+ (-D 


« — 1 


n 


« 


i — 丄 + 

21 ^31 




屮（一 1 广 


n 




这个问题若直接计算有利场合数，无疑是十分复杂的. 


四、可列可加性与连续性 

下面我们对可列可加性作进一步讨论.从性质2知道，由可 
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列可加性可以推出有限可加性；但是一般来讲，由有限可加性并 


不能推出可列可加性. 

事实上，若—1,2,…旦两两互不相容，则由概率 
的有限可加性只能推出 （1.5.2) 成立，即 



(1.5* 10) 


这个等式的左边对任意 n 都不超过1，因此右边的正项级数收敛 • 


这样应有 

n « oo 

limP ( y；^i = = T ^ PiA ) (L 5. 11) 

一 ‘ ,=i 

与 （1.5.1) 比较一下就可以知道，为了具有可列可加性，还需要 
下式 成立： 

n 

limP ( 2^) = /> ( 2^) (1.5.12) 

■ ■ 
i ~ 1 1=1 

或者写成更富有启发性的 等式： 

« n 

limpf = P ( (L 5. 13) 

7| …+ OO . n ^ 

t — 1 t — i 

即要允许把极限号移到概率号里面去，这就提出了一个新要求. 
现在就来考察这个新要求.若记 

，.二 1 

则《= 1 ， 2 ,…而且乂匚 s „ +i ， 即又是中一个单调不 

减的集序列，这时可改写 (1.5.13) 成 下式： 

\ imP ( S n ) = P (\ imS n ) (L 5. 14) 

ti ™ ^ 

一般，对于※上的集合函数，若它对^中任何一个单调不 
减的集序列 {&} 均成立（1.5.14)，则我们称它是下连续的.因 
此前面的推导表明，为保证概率的可列可加性成立，除要求它具 


有有限可加性外，还要求它是下连续的. 


下面的定理明确地阐明了这三个概念之间的关系. 

定理 1. S .1 若尸是上满足 PCH ) =1 的非负集合函数, 
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则它具有可列可加性的充要条件为 
( l ) 它是有限可加的； 

( H ) 它是下连续的. 

[证明]充分性只要重新考察前面的推导过程.实际上，若 
沿用有关记号，则有限可加性保证了 （1.5.10) 的成立，而下连 
续性保证了 （1.5. 13) 即 （1.5.12) 的成立，通过 （1.5. 11) 立 

刻得到可列可加性. 

必 要性： 其中 （ i ) 我们早已建立.为证 Gi ), 设是 
中一个单调不减的集序列，那么 

0^, = lim5„ 

i =\ 

若定义0，贝 ij 


t =1 I = i 

这里的 （乂 一*5,-0, / = 1， 2, …由于* S , 的单调性，显然两两互不 
相容，因此由可列可加性得 




n 


P{ U&) = — ^-i) = - S^ x 


但是 


n 


n 


2 尸 (& — D = P ( XI ⑶ — D 




PiS n ) 


因此 


F(limS„) = \imP(S n ) 

fl—►OO ^oo 

这就证得了 p 的下连续性. 

系 1 概率是下连续的. 

系2概率是上连续的，即若及 e ^， 而且汉=>及 +1 ， (-1, 
2,…则 


lim / HB ”） = P (\ imB n ) (1. 5. 15) 

[证明]记& = E ，则是单调不减的，由系1可得 


暑 
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to 


limP(S ri ) - POimSJ - P (U5,) = p(n^) 

因此由 （ 1.5.3), 可知 

: X ， 

1 - limPCBJ - 1 - P ( p |^) 

■ o 

注意到 limi?, =f| 凡，即得 （ 1.5.15) 

五、概率空间 

在科尔莫戈罗夫的概率论公理化结构中，称三元总体(打, 

P ) 为概率 空间， 其中是样本空间，^是事件域 ，尸是 概率，它 
们都认为是预先给定的，并以此作为出发点讨论种种 问题. 至于 
实际问题中，如何选定/2,怎样构造怎样给定 P , 则要视具 
体情况而定. 

下面讨论几个具体例子. 

[例 7] (有限概率空间）这时 <0中只有 w 个点，这类概率 

空间在§ 2中已有讨论，古典概型即为其特例.在这种场合，一般 

可取■^为的所有子集全体，这仍是-个有限的集合，元素总数 

为 2”， 它满足事件域的三个要求，而且样本点（看作一个单点 

集）是事件.至于概率，只要对样本点叫给定满足 

P{w,) ^ 0, i — 1,2 » *** »« 

Pi ( o x ) + *•• + jP ((*>„) = 1 

的一 组数尸 （叫 ）， P (^), P UO , 那么，若 A 是茨 中元 
素，包含样本点' ，…， '，则由概率的可加性，自然应令 

P{A^) — P(a)j ) 4■"…+ P(o>,) 

I k 

这就给定了事件 a 的概率，从而构成了概率空间 （ fi ， 淨 ， n . 
从这个例子中看到下面两点. 

(1) 选定了 （ a 少 ） 之后，对于事件概率的给定还有相当大 
的灵活性，这表现在尸（叫）的选取上.因为只有这样，才能用概 
率空间来描述不同的随机现象.例如在投一次硬币的试验中 ，0 
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总是由出正面 （叫） 及出反面（叫）两个样本点构成.对于均匀的 

硬币，可以假定它出 E 面及反面的概率均为但对于很不均勻 

的硬币，例如出正面可能性大得多的硬币，则必须给定另外的概 
率，而这只须适当给定/"(叫）就可以了 _ 

(2) 一旦 P (叫）给定后，事件 A 的概率并不能任意给定，即 
在事件域中，各事件的概率有一定关系，给定概率时必须满足这 
些关系. 

[例 8] (离散概率空间） 0 由可列个点 构成： o , 2 , 
…这时茨还是可以选为 *0 的子集全体，它满足事件域的三个 

条件.这时样本点也是事件.为给定概率，可选可列个非负的数 
A ， / = 1，2，…满足 


作为样本点叫的概率，而一般事件的概率，则必须取为它 
所含的样本点的概率之和 • 

[例 9] 若 D ^ R 1 , 即样本空间由全体实数构成，这时 ，■不 
能取为 D 的一切子集，因为这个集类太大，无法在其上定义概率. 
这时通常取为直线上博雷尔点集全体深,，这是相当大的一个 
集类，可以把实际问题中所感兴趣的点集都包括在内.另一方面 
在博雷尔^域上定义概率相当方便，这只要对左闭右开区间给定 
概率即可.这些我们将在第三章中作深入讨论. 

顺便指出，若不是 R 1 ， 而是它的一部分，也可类似处理. 
譬如 D 为一个区间，这时可取为该区间上的博雷尔点集 全体: 
它们通过直线上博雷尔点集与该区间之交而得到. 

[例 10] 若(或 IT 的一部分），这时可类似于一维场 
合取； 1维欧几里得空间中的博雷尔点集全体作为事件域 
在第三章§ 2中将对这种场合进行深入讨论. 

第一章小结 

本章中介绍了 一类新的现象 随机现象，这是一种普遍存 


* 
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在的现象.在大量随机现象中存在着统计规律性，概率论便是研 
究随机现象的数量规律的一门数学学科. 

“事件”与“概率”是概率论中最基本的两个概念，我们在公 
理化结构下严格地定义了这两个概念. 

为了使读者清楚地理解事件与概率的直观意义，我们采用由 
具体到抽象，由简单到复杂，由特殊到一般的方式分别介绍了頻 
率、古典概型、儿何概年，并从中归纳出事件与概率的本质特征， 
为公理化定义作准备，这种讲法基本上与概率概念的历史发展平 
行. 

事件的运算及概率的性质是本章的基本内容，也是学习以后 
各章的必要基础，务必牢固掌搓. 

我们较完整地研究了古典概型，并介绍了它在产品柚样检查 
中的应用.对于古典概型的讨论有助于对概率论基本概念的直观 
理解，而且在以后讨论更一般的情况时，也常以它 
为特例加以 考虑. 古典概型中概丰的计算有较高的技巧性，读者 
应该掌捱一些最基本的计算方法. 

几何概率是很有启发性的一类问題，不过它的严格表述只有 
用到第三章的一些概念才能做到. 

槁清频率与概率的关系是十分重要的一个课題，今后我们将 
一再回到这个问題上来. 

书中我们着重把现代概牟论公理化结构作为一个历史发展过 
程来描述，有兴趣的读者不妨试着进行相反而相成的另一项 工作: 
用公理化结构来概括古典概型、儿何概芈等特殊模型. 

博當 尔点集是一个重要的概念，在第三幸中，它将起关键作 

用. 

习题一 

1. 在某城市中，共发行三种报纸 A , B ， C . 在这城市的居民中，订阅 A 
的占45%，订阅 i ? 的占35%，订阅 C •的占30%，同时订阅/ I 及 J 5 的占10%， 
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同时订阅 A 及 C 的占8%，同时订阅 B 及 C 的占5%,同时订阅4, C 的 
占3%，试求 F 列百分率： （1) 只订阅 的； （2) 只订阅3及5 的； （3) 只 
订阅一种报纸的； （4) 正好订阅两种报纸的； （5) 至少订阅一种报 纸的; 
(6) 不订阅任何报纸的. ' 

2. 若 A ， B , C 是随机事件，说明下列关系式的概率意义： （1) ABC = 
A ； (2) AUBilC = A ； (3) ABCLC ； (4) AdBC . 

3 -试把戌 U u … U 儿表示成 《 个两两互不相容事件的和. 

4. 在某班学生中任选一个同学，以事件 A 表示选到的是男同学，事件 B 
表示选到的人不喜欢唱歌，事件 C 表示选到的人是运动员 .（1) 表述 A5C 
及 ABC; (2) 什么条件下成立 (3) 何时成立 CCS ; (4) 何时同 
时成立 A = B 及 A = C - 

5. 用摸球模型造一例，指出样本空间及各种事件运算. 

6. 若 A,S，C，Z) 是四个事件，试用这四个事件表示下列各事件：（1)这 
四个事件至少发生一个： （2) 5都发生而 C, D 都不发生； （3) 这四个亊 
件恰好发生两个； （4) 这四个事件都不 发生； （5) 这四个事件中至多发生一 
个_ 


*7_从0, 1，2,…，9中随机地取出5个数（可重复）， 以； 记某些数 
正好出现 r •次这一事件（例如52353,既属于也属于五 2 及£。），试用文 
图表示£。， ，…， 的关系 • 


8. 证明下列等式 


⑴ 


+ 2 


+ 3 


+ … + 


rt2 a ~ l 


( 2 ) 


一 2 


2 ) 


+ 3 


U 一 r 

( 3)2 


Ur 


k+r 


k ) 


+ •••+( — 1 




0 


9 . 袋中有白球 5 只，黑球 6 只，陆续取出三球，求顺序为黑白黑的概 


率 • 


10* —部五卷的文集，按任意次序放到书架上去，试求下列概率： （1) 第 
一卷出现在 旁边； （2) 第一卷及第五卷出现在 旁边； （3> 第一卷或第五卷出 
现在旁边； （4) 第一卷及第五卷都不出现在旁边； （5) 第三卷正好在正中. 
11•把1, 2, 3, 4, 5诸数备写在一小纸片上，任取其三而排成自左向 
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右的次序，求所得数是偶数的概率. 

12. 在一个装有《只白球，《只黑球，《只红球的袋中，任取 m 只球，求 
其中白、黑、红球分別有 m ; ， m ? ， w 3 {mi + m 2 -\- mm ) 只的概率 * 

13. 甲袋中有 3 只白球， 7 只红球， I 5 U 黑球，乙袋中有10只闫球，6 
只红球，9只黑球，现从两袋中备取一球，求两球颜色相同的概率. 

14. 由盛有号码1，2,…， V 的球的箱子中有放回地摸了；7次球，依次 
记下其号码，试求这些号码按严格上升次序排列的概率_ 

15. 在上题中这些号码按上升（不一定严格）次序排列的 概率. * 

16. 任意从数列1, 2,…， TV 中不放回地取出;2个数并按大小排 列成： 

: Ti < : C 2 < … 〈… 〈 A ， 试求； =从的概率.这里 

，17. 上题中，若采用有放回取数，这时试求 
h 二 M 的概率 • 

18. 从6双不同的手套中任取4只，问其中恰有一双配对的概率是多 
少？ 

19. 从 n 双不同的鞋子中任取 2 r (2 r < r /) 只，求下列事件发生的概率： 
(1) 没有成对的鞋 f ; (2) 只有-对鞋子； （3) 恰有两对鞋子； （4) 有 r 对 

鞋子 • 

20. 袋中有《只球，记有号码1，2,…，《，求下列事件的概率： （1) 任 
意取出2球，号码为1，2; (2) 任意取出3球，没有号码1; (3) 任意取出 
5球，号码1，2，3中至少出现一个， 

21. 袋中装有1, 2,…，/ V 号的球各一只，采用 （1) 有 放回； （2> 不放 
回方式摸球，试求在第々次摸球时首次摸到1号球的概率 * 

22. m 个男孩和《个女孩 « m ) 随机地沿着圆桌坐下，试求任意两个 

女孩都不相邻的概率. 

23* (分赌注问题）甲、乙二人各出赌注〜约定谁先胜三局则贏得全 

部赌注，现已赌三局，甲二胜-负，这时因故中止赌博，若二人赌技相同，问 
应如何分配赌注，才算公平合理？ 

24. 从52张扑克牌中任意取出13张来，问有5张黑桃，3张红心，3张 
方块， 2张草花的概率 • 

25. 挢牌游戏中（四人各从52张纸牌中分得13张），求 4 张4集中在一 
个人手中的概率. 

* 26. 在扑克牌游戏中（从52张牌中任取 5 张），求下列事件的概率: 
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(1) 以 4 打头的同花顺次五张牌； （2) 其他同花顺次五张牌； （ W 有四张牌 
同 点数； （4) 三张同点数且另两张也同点数； （5) E 张同花； （6) 异花顺次 
五 张牌； （7) :三张同点数，另外两张不冏点数； （8) 五张中有 两对； （ 9 )五 
张中有一对； (10) 其他情况. 

27. 某码头只能容纳一只船，现预知某日将独立来到两只船， 且在 M 小 
时内各时刻来到的可能性都相等，如杲它们需要停靠的时间分别为3小时及 
4小时，试求有一船要在江中等待的概率. 

28. 两人约定于7点到8点在某地会面，试求一人要等另一人半小时以 

上的概率. 

29. 在一线段 AiJ 中随机地取两个点把线段截为2段， 求这二 段可以构 
成一个 彳角形 的概率（:卩线段能构成三角形的充要条件是任意二边之和大十 
第5边） • 

30- 在线段[0, 1] 上任意投三个点,问由0 至三 点的三线段能 构成: £ 
角形与不能构成王角形这两个事件中哪一个事件的概率大 • 

31. 在一张打上方格的纸上投一枚 t 径为1的硬币，方格要多小才能使 
硬币与线不相交的概率小于1%. 

32. 从（0, 1) 中随机地取两个数，求下列概率： （1) 两数之和小 f 1. 2; 

(2) 两数之积小于+; (3) 以上两个要求同时满足. 

33. 设 A ， ，…，九是随机事件，试用归纳法证明下列公式 

P ( A , u 4 U … U A ) = »( A .) — 2 P { A t A 3 ) 

1 l<i'< j^n 

-\- 2 尸 ( AAA )— … 

+ (- l 广 1 尸 (AAO 

34. 某班有厂个士兵，每人各有一支枪，这些枪外形完全一样，在一次 
夜间紧急集合中，若每人随机地取走一支枪，问至少有一个人拿到自己的怆 
的概率. 

•35. 在上题中求恰好有 i ( O ^ k ^ N ) 个人拿到自己的枪的概率. 

*36. 考试时共有 W 张考签，《个学生参加考试被抽过的考签 
立刻放回，求在考试结束之后，至少有一张考签没有被抽到的概率 • 

•37 •甲，乙，丙三人按下面规则进行比赛，第一局由甲，乙参加而丙轮 
空，由第一局的优胜者与丙进行第二局比赛，而失败者则轮空，比赛用这种 
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方式一直进行到其中一个人连胜两局为止，连胜两局者成为整场比赛的优胜 
者，若甲，乙，丙胜每局的概率各为+，问甲，乙，丙成为整场比赛优胜者 
的概率各是多少？ 

*38 .父，母，子三人举行比赛，每局总有一人胜一人负（没有和局），每 
局的优胜者就与未参加此局的人再进行比赛，如果某人首先胜了两局，则他 
就是整个比赛的优胜者，由父决定第一局由哪两人参加, 其中儿 子实力最强， 
所以父为了使自己得胜的概率达到最大，就决定第一局由他与妻子先比赛， 
试证父的决策为最优策略（任何一对选手中一人胜对方的概率在整个比赛中 
是不变的） • 

39. 给定 /> = 尸 04)，g 二 = PCA (J 万），求尸 MB ) 及 P(AB). 

*40. 已知： P(AB) = P(A)PiB),CZ) AB,C 3 A B ， 证明： PMC) > 
P(A)P(C) . 

41 •设 P \， p z 、 Pu 是给定的实数，试存在两个事件烏及次使得 
PiA x ) = p ^ PCA ,) = p ^ PiA ^ = p l2 的充要条件是下列四个不等式同 
时 成立： 

物 

Pn ^ 0 ~ pi2 ^ Q ， p : 一 PiZ ^0^1 一 Pl — p 2 Pl 2 ^ 0 

M 2. 用概率论想法求 W 阶行列式的展开式中包含主对角线元素的项数 


H 利用概率论的想法证明下列恒等式： 

I A — a {A — a) {A 一 a — 1) . I (A — a)".2 • 1 _ A 

1 + + (A - l)(A — 2) 一 + ••• + 04 — 1) … (a + lk = T 

其中 a 都是正整数，且乂>心 

•44. 从一只装有100只灯泡的箱子中任抽5只灯泡，发现有2只是次 
品，你对此批灯泡的次品数作何估计?（比较用最大似然估计法所得结果与用 
频率估计概率法的结果是否 相同. 这种抽査当然用不放回方式 .） 

45. 求包含事件4， S 的最小 a 域. 

46. 证明： 的-切子集组成的集类是一个”域- 

47. 证明： a 域之交仍为 a 域. 

48- 证明： 包含一切形为 （一 oo, 1) 的区间的最小域是一维博雷尔 a 
域. 

49. 设 Q 是定义在 a 域上的非负广义实值函数（即可以取有限或无限值 
的函数），如果它具有可列可加性，并且 Q (0) =0,则称 Q 为测度，试说 

• 54 • 



明测度概念是算术中计数概念及几何中长度、面积、体积等概念的推 

广 • 

50. 用测度概念解释古典概型、几何概率及概率论公理化结构中关亍概 
率的 定义. 
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第二章条件概率与统计独立性 


§1. 条件概率，全概率公式，贝叶斯公式 




条件概率 


对概率的讨论总是在--组固定的条件限制下进行的.以前的 

讨论总是假定除此之外再无别的信息可供使用，可是，有时我们 

却会遇到这样的情况，即已知某一事件 B 已经发生，要求另一事 

件 Z 发生的概率.例如考虑有两个孩子的家庭，假定男女出生率 

一样，则两个孩子（依大小排列）的性别为（男，男），（男， 

女），（女，男），（女，女）的可能性是一 样的. 若以 Z 记随机选 

■ 

取的这样一个家庭中有一男孩、一女孩这一事件，则显然 


P ( A ) =4-, 但是如果我们预先知道这家庭至少有一个女孩，那 


么，上述事件的概率便应是 I . 




种情况下，我们多知道了一个条件：事件5 ( 这一家庭至少有一女 
孩）发生，因此我们算得的概率事实上是“在已知事件6发生的 
条件下，事件4发生的概率”，这个概率我们将记之为尸 ( A \ B ). 

这种带有条件的概率很重要，下面我们就来研究它.在给出 
严格定义之前，先考察一些特殊的场合. 

就从上述例子出发，这是一个古典概型问题，样本点总数《 = 

4 ， 有利于事件 A 的场合数 jw>i = 2 ， 因此尸 (A ) = i ;但是假如已 

知事件 B 发生，即至少有一女孩，那么可能发生的样本点是（男， 
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女） • （女~男）， （ 女.女） • 总数为而有利场合 
-女孩，釘 - W 孩、- ■女 孩） 数= 2 ， 因此 

m AB 



m Ah 




P(AB) 

P(B) 


(至少甸 


(2. U 1) 


这式 f 很就要， 虽然我们以特例形式引入，但读者不难证明 •它 
对•般古典溉型问题也成立. 

在几何慨率中，荇以 m ( A )， m ( B ), m { 0 ) 分別记 

事件儿凡 AB , D 所对应点集的测度，且>0,贝1] 




m (AB) 

m(AB) = m(0) = P(AB) 

m(B) m(B) P(B) 

m ( if 2) 


结果与古典慨型相同. 

对频率也有类似结果，请读者自行验证. 

在-般场合，我们将把这个算式作为条件概率的定义. 

定义 2 . 1. 1 设07, •，，尸）是一个概率空间， Be ^\ ra 
且 P ( B )>0， 则对任意,4€乂，记 

P ( A \ B ) = P pf ^ (2. 1.2) 

并称尸 ( A ^ B ) 为 在事件 B 发生的条件下事件 A 发生的条件概率 

(conditional probability ). 

若未经特別指出，今后出现条件概率尸时，都假定 


PiB) >()• 

山 （2.1.2) 立刻得到 

P(AB ) 二 P(B)P(A\B) (2. L 3) 

这个等式被你为概率的乘法公式或乘法定理. 

若还有 PU ) >0,则也可定义尸(方4)，这时有 

P(AB) - P(A)P(B\A) = P(B)P{A\B) (2* L 4) 

[例 1] 在肝癌普查中发现，某地区的自然人群中，每十厅 
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人内平均有 40 人患原发性肝癌，有34人甲胎球蛋白高含量，有 
32人既患原发性肝癌又出现甲胎球蛋白高含量. 

从这个地区的居民中任抽一人，若他患有原发性肝癌则记为 
C , 甲胎球蛋白高含量记为乃，这时 

P(C) = 0.0004, 尸 ⑴ ）= 0. 00034, 尸 （ CD) = O. 00032 

由条件概率定义可得 ' 

尸 (DlO = 尸 _ 0* 00032 _ ^ o 

( 1 ) — P{C) ~ 0- 0004 — 0 . 8 


P ( C | D ) = 


P(CD) 

P(D) 


0. 00032 
0. 00034 


= 0. 9412 


通过计算得知，患原发性肝癌的人有80%其甲胎球蛋白呈现 
出高含量，而甲胎球蛋白的测定大大有助于发现原发性肝癌 患者: 
若出现高含量，则有高达94%以上的概率对患原发性肝癌作出正 
确诊断. 

由于事件 D 的发生，使事件 C 发生的概率由 0.0004 —下子 
上升到 0.9412. 可见，事件发生的概率，与条件有关，也即与信 
息有关. 

下面讨论条件概率的性质. 

首先，不难验证条件概率 P (A | 忍)具有概率的三个基本 性质: 

非负性、规范性、完全可加性. 

( i ) P ( A \ B ) >0； 

( ii ) PCO \ B ) = 1 ; 

tJX : * 

_ 

( iii ) P ( 2^1^) 

i=i pi 

因此，类似于概率，对条件概率也可由三个基本性质导出其 
它一些性质，例如 

P ( 0 \ B ) =0 

PiA \ B ) =1 —尸 

PiA i UA 2 \ B )= P ( A l \ B )-\- P ( A 2 \ B )- P ( A 1 A 2 \ B ) 


争 
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特别当 万=0 时，条件概率化为无条件概率，因此把一般的概率看 
作条件概率也未尝不可. 

可以把乘法公式推广到任意〃个事件之交的 场合： 


PiA.A^AJ = P(A,)P(A 7 \A)P<iA,\A } A ? ')^ 



( A n \ A x A 2 -* A , 


一 1 


(2. 1- 5) 


> 0 . 


这里当然要求尸(戏义…乂 

[例 2] (波利亚罐模型）罐中有6只黑球及 r 只红球，随机 
取出一只，把原球放回，并加进与抽出球同色的球 c 只， 

次，这样下去共摸了 n 次，问前面的〜次出现黑球，后面的 



n 2 


= n - n , 次出现红球的概率是多少？ 

[解]以4表示第一次摸出黑球这一事件， 
〜次摸出黑球，八 v +1 表示第 m + l 次摸出红球， • 
次摸出红球.则 

F(A 1 ) = r 4-7.» PiA z \AO= b ^~ C 


表示第 
儿表示第 n 


6 +r 


P(A 3 1v4i^4 2 ) 




厶 +2( 


6+ r +2 c ， 


b^r ( 打 i 一 1 )c 


P( 〜 +1 …儿 i ) = 6 _ j_ r +„ iC 


P (A n ^ 42 1 乂 1 … 凡 , +i) 


r+c 


厶 + r 十 ( n x + l)c 


尸（九 I 耒… 儿叫） 


r + ( n 2 — l)c 
6+ r + (rt 一 l)c 


因此 


P(A X A Z —A n ) 


b + 


b 2 c 


h —— 


b r c 6 + r + 2 c 


6+ ("i — l) c 

h + r^r ( n x —1) 


* 


r+r 
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r+ (n 2 — l) c 

• •攀 - - —- - - - - - 

6 + (n- 1) c 

注意这个答案只与黑球及红球出现次数有关，而与出现的顺序无 

关. 

这个模型曾被波利亚 （ P 6 lya ) 用来作为描述传染病的数学模 
型.这是很一般的摸球模型，特别取 c = 0, 则是有放回 摸球； 取 
f =~ l , 则是不放回摸球. 

二、全概率公式 

概率论的重要研究课题之一是希望从已知的简单事件的概率 
推算出未知的复杂的事件的概率.为达到这个目的，经常把一个 
复杂事件分解为若干个不相容的简单事件之和，再通过分别计算 
这些简单事件的概率，最后利用概率的可加性得到最终结果.这 
里，全概率公式起着很重要的作用. 

设事件 A ， /1 2 ,…，九，…是样本空间 D 的一个分割，即 A 
G = l ， 2， …， 《，…）两两互不相容，而且 

z 二 i 

这样一来 


B= J]A r B 

:二 1 

这里的 A ■召（/ = 1 ，2，…，” ，…）也两两 
互不相容（参看图 8). 

由概率的完全可加性 

P(B) = Y^PiA^B) 

i - 1 

再利用乘法公式即得 

■O 

I)(B) 二 y^PiA^PiBlA) (2*1,6) 

7 - 1 

这公式称为 全概率公式， 它是概率论的一个基本公式，有着多方 
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間8样本空间的分割 



面的应用. 

从推导中可以看出，当 P (儿）=0时，只要把相应的项当作 
0即可.在多数问题屮， （2.1.6) 式只含有限项. 

[例 3] 送检的两批灯管在运输中各打碎一支.若每批十支， 
而第一枇中有1支次品，第二批中有2支次品.现从剩下的灯管 
中任取一支，问抽得次/品.的概率是多少？ 

[解]以方表示抽彳 | 次品这一事件，为求其概率，有下述两 
种解题思路，都可以得到最终答案. 

思 路一. 考虑抽得的灯管出自哪一批，以 Z 表示灯管出自第 


批，这样一来，X表示灯管出自第二批.显然 F(i4) 






18 , 


P(A) 


18 * 


为计算 P(B|A)， 必须分别考虑第一批中打碎的是次 


品还是好品，从而得到 






10 


X0 + 咅 X 




10 


，同理 




因此 


P(B) = P(A)P(B\A) + P{A)P(B\A) 






20 


思路二.直接分析打碎灯管的各种可能情况，以事 
^3, A 分别记前后两批中打碎者为（次，次）， （ 次，好），（好， 


7^1^^其概率为尸(儿）=了|^，尸 (A 2 ) = y ^, 尸 (為 ）=#， 

p(AO = iob ' 在事件 A 发生的条件下，事件 B 的条件概率容易求 


得为尸(万|4)=合， P ( BM 2 ) = 合，尸(£|乂 3 )=合，户(凡|山) 




18 


，因此利用全概率公式， 


4 


P(B) 


^P(A)P(B\A t ) 




20 


两种解法都是利用全概率公式.从例中还可看出全概率公式 
之所以有力，就在于它概括了一种普遍的解题思路：化整为零，各 
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个击破. 


三、贝叶斯 ( Bayes ) 公式 


若事件 S 能且只能与两两互不相容的事件 Am A 2 , 


# «攀 


> An ♦ 


之一同时发生，即 


B 


1>八 


由于 


P(AB) = P(B)PiA t \B) = PCA^PCBIA,) 


故 


PiA t \B) 




P(A t )P(B\A t ) 

PCS) 


再利用全概率公式即得 

P(A t \B) 




PiA^PCBlA^ 


oo 


2 尸⑷ p (寧 ,) 


这个公式称为贝叶斯公式. 


(2. 1. 7) 


贞叶斯公式在概率论和数理统计中有着多方面的应用.假定 

试验结果的“原因 ”， P ( A ) 称为先 验概率 ，它 




反映了各种“原因”发至的可能性大小，一般是以往经验的总结， 
在这次试验前已经知道.现在若试验产生了事袢召，这个信息将有 
助于探讨事件发生的“原因”.条件概率 P ( A ^ B ) 称为后验 槪率， 
它反映了试验之后对各种“原因”发生的可能性大小的新知识.例 
如在医疗诊断中，有人为了诊断病人到底是患了疾病4，…, 
中的哪一种，对病人进行观察与检査，确定了某个指标 B (譬 
如是体温、脉搏、血液中转氨酶含量等等），他想用这类指标来帮 
助诊断.这时就可以用贝叶斯公式来计算有关概率，首先必须确 
定先验概率尸 C 4,) ,这实际上是确定人患各种疾病的可能性大小， 
以往的资料可以给出一些初步数据 r 其次是要确定 P ( BIA )， 这 
里当然主要依靠医学知识.有了它们，利用贝叶斯公式就可算出 
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PCA ,\ B ). 显然，对应于较大尸 （ AliO 的“病因”八，应多加考 
虑.在实际工作中，检査的指标5—般有多个，综合所有的后验 
概率，当然会对诊断有很大帮助.在实现计算机自动诊断或辅助 
诊断中，这方法是有实用价值的. 

下面介绍应用贝叶斯公式的几个例子. 

[例 4] 在数字通信中，由于存在着随机干扰，因此接收到 
的信号与发出的信号可能不同，为了确定发出的信号，通常要计 
算各种概率，下面只讨论一种比较简单的模型——二进位信道. 

若发报机以 0. 7和 0. 3的概率发出信号0和1 (譬如分别用 
低电平与高电平表示），由于随机干扰的影响，当发出信号0时， 
接收机不一定收到0,而是以概率 0. 8和 0. 2收到信号0和1 同 
样地，当发报机发出信号1时，接收机以概率 0.9 和 0.1 收到信 
号1和 0. 其关系如图9所示. 

假如接收机收到信号0，则这时^ 

有两种可能 情况： 第一种情况是发报 ° 

机确实发出信号0，而信号传输中没 
有出错；第二种情况是发报机发出信 i 

号1，但是传输中出现错误，因此接收 
到信号 0. 所以在这类问题中，计算 图 9 

“当接收机收到信号0时，发报机是发出信号0的概率”便很有必 
要， 

把发报机发出信号0记为事件 A 。， 发出信号1记为事件或, 
接收机接到信号0记为事件我们要求的是 PUol ^). 

由于 P ( A 0 )~0. 7 t P (. Ai )—0. 3 fP(B I ^ 0 ) = 0. 8, F(B |> li )= 
0.1， 用贝叶斯公式， 



P ( A 0 \ B )= 


P ( A 0 ) P ( B \ A ^ 

P ( A 0 ) P ( B \ A 0 ) + PiA ,) P { B \ A x ) 


[例 5] 


0.7 X 0. 8 

0. 7 X 0. 8 + 0. 3 X 0. 1 


0. 56 
059 


= 0. 949 


假定用血清甲胎球蛋白法诊断肝癌， PU | C ) = 
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0* 95, P (A \ C ) =0. 90,这里 C 表示被检验者患有肝癌这-事件， 

^表示判断被检验者患有肝癌这一事件.又设在自然人群中 
P ( C ) = 0 . 0004 . 现在若有一人被此检验法诊断为患有肝癌，求此 
人真正患有肝癌的概率 P ( C \ A ). 

[解]由贝叶斯公式， 


P ( r \ A )^ _ P ( C ) P ( A \ C ) _ 

1 — P ( C ) P ( A \ C ) f P ( C ) P ( A \ C ) 


0.0004 X 0. 95 

0, 0004 X 0. 95 + 0. 9996 X 0* 1 


= 0* 0038 


既然检验法相当可靠，那么为什么用该法诊断为肝癌的人真 
正患有肝癌的可能性却如此之小呢？经过分析可以看出，主要是 
先验概率 P ( c ) 很小 • 对自然人群来讲肝癌毕竟是一种罕见病.如 
果我们检查的是一个肝癌的可疑人群，譬如一批普查中筛选出的 

甲胎球蛋白高含量者，这时相应的先验概率就高得多，例如就取 
例1中的 0. 9412，那么 


P ( C \ A ) 




0. 9412 X 0. 95 


0. 9412 X 0. 95 + 0. 0588 X 0. 1 


0. 9935 


因此相应的后验概率也就大为提高.实际普查中正是如此一级一 
级筛选的. 


这个数值例子给我们的最大启 示是： 后验概率的大小很受先 
验概率选取的影响. 

在贝叶斯公式的使用中，最有争议之点就是先验概率的选取. 
我们上面所举的两个例子中，这些先验概率都是通过以往大量实 
际调查而得出的，符合概率的频率解释，因此使用中不致于发生 
疑问. 

不过， 在贝 、叶斯公式的使用中也还存在着另一种情况，就是 
先验概率是由某一种主观的方式给定的，譬如对于未来宏观经济 
形势的看法，对物价、利率、汇率变化的估计，对某种新型产品 
上市后受欢迎程度的预估，甚至对某星球上存在生命现象的估计 

等等.这种把概率解释为信任程度的做法含有明显的主观性，称 

• 64 * 



j { 观概 率与卩"[叶 断学派的发展息 a 扣关，后者在.二战后以於 
很快发展，理论上与决策理论关系密切. 并 M 找到不少 应用 . N 
此对 r .] i 观概率的争论符来将长期持续卜'去. 

w 叶斯//法的大域应用出现在决策 h 题屮，卜'面是 n 动 iU 别 
系统的一个例子. 

[例 6] (1；1叶斯决 策 ). %j r 判断-个屮母是还是 
•‘。”,通常采用先抽取它的某一个特征 X ，然后冉恨据这个特征作 
出判决，这时贝叶斯决:策是常用方法之一. 

以4，為分别记被检验的字母为 C 或 o 这一菸件，它们的先 
验概率 /M yl ! ) 及厂 （ A ) 应预先给定，此外要通过试验确定 
P ( XiA ) 及 P ( X |/ U ， 由贝叶斯公式得 

P ( A , | X ) - 

^P{A ; )P{X\A t ) 

I = ] 

其中，；二1， 2 .若八4|；0> 尸 (/ UX )， 则作出 决策： 具有持征 
X 的字母是 C . 

这个方法在模式识别这一新兴学科中有重要应用,当然，这 
里是大为简化了的模型. 

§ 2. 事件独立性 

一、 两个事件的独立性 

本节中我们引进‘个新的概念 一 统计独立性.先从两个事 
件的独立性汗始，然行讨论更为一般的场合. 

还是从考虑占典概型的- 个例子作为出发点. 

-例 1] 门袋中 装有 《 只黑球和6只白球，采用有放网摸 
球 ，求： 

( 1)在已知第■次摸得黑球的条件下，第二次摸出黑球的概 


* 
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率 f 


(2) 第二次摸出黑球的概率. 

[解]以事件 A 表示第一次摸得黑球，事件 B 表示第二次摸 


得黑球.则 


P(A) 









h 


ia + h) z 


,PCAB) 


ba 


(a + bY 


所以 


PCB\A) 




PCAB) 

P(A) 


a 


< 3+6 


而 


P(B) = PCAB) 4 - P(AB) 


2 




+ &) 



ba 


(a + b) 




注意这 里的尸 CBM ) = P ( B ) 9 即事件 A 发生与否，对事件 5 发 
生的概率没有影响.从直观上讲，这很自然.因为我们这里采用 
的是有放回摸球，因此第二次摸球时袋中球的组成与第一次摸球 
时完全相同，当然第一次摸球的结果实际上不影响第二次摸球.在 
这种场合可以说，事件 A 与事件五的出现有某种“独立性”. 
对此，我们引进 

定义 2. 2.1 对事件4及 B ， 若 

PCAB)=P(A)P(B) (2.2.1) 


则称它们是 统计独立的， 简称 独立的 ( independent ). 

注意，按照这个定义，必然事件 X 3 及不可能事件0与任何事 
件独立.此外，从 （2.2.1) 中看出，/与方的位置对称，因此亦 

称 A 与 fl 相互独立. 


推论 1若事件儿5独立，且尸 ( B )>0, 则 

P(A{B)=P(A) 

[证明]由条件概率定义及 （2.2. 1) 得 


( 2 . 2 . 2 ) 


P(B) 


P(B) 
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因此，若事件万相互独立，则,4关于万的条件概率等于无条 
件概率 P (/) ，这表示 i ? 的发生对于事件 A 是否发生没有提供任 
何信息，独立性就是把这种关系从数学上加以严格定义. 

推论2若事件 A 与石独 立，则下列各对事件也相互 独立： 

{Z ， 5}, {A ， B} ， {A ， B} 

[证明]由于 


P ( AB ) = P ( B - AB )= P ( B )- P ( AB ) 

= P ( A ) P ( B ) 


所以灭与方相互独立，由它立刻推出3与 S 相互独立，由 
又推出 A ， B 相互 独立. 

不放回摸球模型提供了不独立的一个简单的例子. 

[例 2] 在前例中，若采用不放回摸球，试求同样那两个事 
件的概率. 

[解]这时 


m 


P ( A ) 


a 


cl -\~b 


, P ( AB ) 


a(a — l) 




(a-hb)(a-\-b—l) 


所以 


P ( AB )^ 


ba 


( a + 办 ）（ a + 厶一 1) 


P ( B \ A ) 


a 


1 


P { AB ) 

P ( A ) = a ^ b-l 


P ( B )= P ( AB ) + P ( AB)=^ l 

这里 /MB | Z ) 美 P ( B )， 即事件 B 与事件 4 不是相互独立的.因 
为第一次摸得黑球，事实上已使袋中球的组成成份改变了，当然 
要影响第二次摸得黑球的概率.而户04)=户(五），则再次证明抽 
签与顺序无关. 


警 





二、多个事件的独立性 


我们先定义三个事件 A ， 月， C 的独立性. 

定义 2 . 2 .2 对于:三个事件 A ， B ， C ， 若下列四个等式同时 
成立，则称它 们相互独立. 

P(AB) = P{A)P{B)' 

P(BC)=nB)P(iC) I (2. 2 . 3 ) 

P(AC)=P(A)P(C), 

P(ABC)-P(A)P(B)P(C) (2.2.4) 

按两个事件独立性的定义，我们知道若 （2. 2. 3) 成立，则 A 与方， 
B 与 C ， C 与 d 都相互独立，即石， C 两两独立. 

读者自然会提出这样一个问 题：三 个事件5, C 两两独立， 
能否保证它们相互独立呢？即能否由 （2.2.3) 推出 （2.2.4)? 回 
答是否定的，这从下面简单的例子就可看出. 

[例 3 ](伯恩斯坦反例）.一个均匀的正四面体，其第一面染 
成红色，第二面染成白色，第三面染成黑色，而第四面同时染上 
红，白，黑三种颜色.现在以5, C 分别记投一次四面体出现 

红，白，黑颜色朝下的事件，则由于在四面体中有两面有红色，因 
此 


尸⑷=+ 

同理尸 ⑻二尸 ( C ;) 二如容易算出 

P{AB) = P{BC)=PiAC) = \ 

4 

所以 （2. 2. 3 )成立，即/ I , 石， C 两两独立，但是 

P { ABC )-^\^\ = P { A ) P ( B ) P { C ) 

4 o 

因此 （2.2.4) 不成立，从而 A ， 召， （：* 不相互独立. 

下面再提供一个例子说明由 a 2. 4) 不能推出 （2.2.3), 进 
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步说明要3， r 相互 独左 必须同时要求（2_2.3)及 


( 2 , 2 



成立. 

例4=若有 - •个均 匀正八面体，其第1，2, 3, 4面染红色， 
第1，2, 3, 5面染白色，第1，6, 7, 8面染上黑色，现在以 A 
B ， C 分別表示投一次正八面体出现红，白，黑的事件，则 


P(A)=P(B) = P(C)^ 


P(ABC) 




P(A)P(B)P(C) 


但是 


層)二»尸04 謂 


现在我们町以定义《个事件的独立性. 

定义 2. 2. 3对”个事件為，，…， A *， 若对于所有可能 

的组合成立着 

P(A l A J )=P(A i )P(A J ) ’ 

P(A,A J A k )=P(A,)P(A j )P(A k ) 

- > (2. 2.5) 

尸•.儿…尸（儿入 

则称 …， 凡相互独立. 

这里第一行有个式子，第二行有^个式子等等，因此共 

\ 乙! \ 6! 

应满足 



n 

3 


— ••- ―|— 


n 


n I 



个等式 • 由三个事件的场合可看出同时满足这些关系式是必须的. 

显然若《 t 事件相互独立，则它们中的任何 m (2< m <«) 个 
事件也相互独立.此外对于多个相互独立的事件也成立着类似于 


上述推论1及推论2的结果，读者试自行叙述并验证之. 

最后，称无穷多个事件是相互独立的，如果其中任意有限多 






个事件都相互独立. 

三、事件独立性与概率的计算 


从事件独立性的定义立刻能 看岀： 若事件是独立的，则许多 
概率的计算就可以大为 简化. 下面先举两个例子. 

[相互独立事件至少发生其一的概率的计算]若 山 ，…， 
凡是 n 个相互独立的事件，则由于 

Ai LM2U … \JA„^A X A Z —A„ 


因此 

P { A X LM2U … U 戍）=1—尸 (AA …九） 

=1—尸 (瓦) P (瓦） … PG 5”） 

( 2 . 2 . 6 ) 


这个公式比起不独立的场合，要简便得多，它经常被用到 • 

[例 5] 假若每个人血清中含有肝炎病毒的概率为0.4%，混 
合100个人的血清，求此血清中含有肝炎病毒的概率. 

[解]以 A G = l ， 2 ,…， 100) 记第 ； 个人的血清含有肝 
炎病毒这一事件，可以认为它们相互独立，所求概率为尸 (▲!>•• 
LUu )。）， 由 （2. 2.6) 得 

虽然每个人有病毒的概率很小，但是混合后则有很大的概率，在 
实际工作中，这类效应值得充分重视. 

[在可靠性理论中的应用]对于一个元件，它能正常工作的 
概率/>，称为它的可靠性.元件组成系统，系统正常工作的概率称 
为该系统的可靠性 • 随着近代电子技术的迅猛发展，关于元件和 
系统可靠性的研究已发展成为一门新的学科 —— 可靠性理论. 
这里，我们通过一些例子来说明有关的概念. 

[例 6] 如果构成系统的每个元件的可靠性均为〜00<1， 
且各元件能否正常工作是相互独立的，试求下面附加通路系统的 
可靠性[见图10 ( a )]. 
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[解]每条通路要能正常工作，当且仅当该通路上各元件正 
常工作，故其可靠性为 

Rc — r 71 

即通路发生故障的概率为1 一 r ". 由于系统是由两通路并联而成 
的，两通路同时发生故障的概率为 （1— r ”) 2 , 因此附加通路系统 
的可靠性为 

Rs=l~(l-r n y^r n (2~r n )=R c (2~Rc) 

注意到 R C <1， 故 Rs > R c ， 所以附加通路能使系统的可靠性增加. 

[例 7] 在前例条件下，试求下面附加元件系统的可靠性 
[见图 10 ( b )]. 

[解]每对并联元件的可靠性为 

R f = 1 — (1 — r) 2 ~r(2 一 r) 

系统由各对并联元件串联而成，故其可靠性为 

R , s =(R f r^r n (2-r) n 

显然 R ' s > Rc 因此用附加元件的方法同样也能增加系统的可靠 

性參 



(b) 

图10附加备份系统 

利用数学归纳法不难证明当时， （2 — r )”>2— r rt ， 即 

琴 

R f s > Rs ^ 因此虽然上面两个系统同样由 2 n 个元件构成，作用也 

相同，但是第二种构成方式比第一种方式可靠性来得大.寻找可 
靠性较大的构成方式也是可靠性理论的研究课题之一. 
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从上述讨论可以 看出， 元件与系统的可靠性是用概率来定义 
的，所以慨率论是研究II了 t 性理论的 贯要 工具. 

四、试验的独立性 

有了事件独立性的概念，我们可以定义试验的独立性.直观 
h, 试验£,与试验要能说是浊立的，应是指 试验& 的结果的 
发生与 试验私 的结果的发生是独立的，所以自然想到通过齐试验 
的事件间的独立性来定义试验的独立性.为了做到这点，首先要 
构造一个能描述这些试验的公共的样本空间. 

设试验 A 的样本空间是 A 二 b 11 '}， 试验& 的样本空间是 
a 2 ={ o >^) y ……试验£„的样本空间是 a= w (n) 丨，为描述这《次 
试验，应构造复合试验五，它表示依次进行试验&，…，匕， 
其样本点为 

to— (o> u) ， a> (r) ， … ， a> <n) ) 

这个样本空间记作 

X A X … X 认 

[例幻若试验 K 是掷一枚硬币，辽=:正 * 反 K 试验£ 2 
是从装有红白黑三球的袋子中摸出 一 球，认二{红.1_ £ :1，黑丨，则 
复合试验£表示先掷一枚硬币再摸一球，它相应的样本空间 = 
A xa 2 由下列6个样本点 构成： （正，红）. (iK. H). (正， il). 
(反，红），（反，白），（反，黑）. 

接着我们可以引进“与第々次试验有关的事件”的概念，这种 
事件发生与否仅与第々次试验的结果有关，即 为了判 断某一样本 
点是否属于这 个事件 • 只须察看它的第々个分量.例如在例8中， 
“第2次试验摸出红球”这 • • 亊件就是-•个与第2次试验有关的# 
件.值得指出，必然钭件 D 及不可能事件0可以认为与所有的试 
验有关. 

现在若以记与第々次试验有关的事件 全体， 则可以通过 
下列方式定义试验的独立件 . 
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定义 2 . 2 . 4 若对 IMF : 意的 

/I …， /TK 

均成立 

IHA ( A' rl) ) = P(A <]) )PiA { 2 , )--P(A iri) ) 

则称试验 A ， A ， ….^是相互独立的. 

注意到 D ，/二:1，2，…， "，因 此由定义立刻推出， 
n 个试验柑迁独立，则其中的 m ( lKm < n ) 个试验也是相互独立 

的. 

在例 8 中，荇对样本空间中的 6 个样本点都给定概率 | • 

则不难验证试验& V 试验& 是相互独 立的. 读者可以思考…下， 
是否还可以给定其他概率使试验&与试验五 2 独立？ 

次有放问摸球所构成的《个试验是相瓦独立的，而《次不 
放回摸球模型则是〃个试验不独 V :的简单例子 . 

特别重要的-炎:试验是所谓重复独立试验，这时二… 
=仏，有关彳 H 牛的概率保持不变， ifffU 各次试验是相互独立的.投 
^次硬币或进行〃次钉放冋 摸球足 重复独立试验的简单例子.重 
复独立试验是作为“在 N 样条件下重复试验”的数学模型而出现 
的，它在概率论中很冇地位 .因 为随机现象的统计规律性只打在 
大 M 重复试验中才会敁示出来. 

我们在 F •订将研究•类最简单的重复独立试验•--伯努利 

(Bernoulli) 试险. 

¥ 3. 伯努利试验与直线上的随机游动 


、 伯努利概型 


在汴名问题中，我们对试验感兴趣的是试验中某事件 / T 是否 
发生.例如在产品抽样检查中注意的是抽到废品，还是抽到 好品: 
在掷硬币时注意的迠出£而还是出反面.在这类问题中我们可以 


m 






把事件域取为梦 = 彳0, 儿叉，仍，并称出现乂为“成功”，出 
现万为“失败”.这沖只有两个可能结果的试验称为 伯努利试验. 

有些试验的结果不止两个，譬如，在电报传输中，既要传送 
字母 A ， B ， …， Z 等，又要传送其他符号.但是假如我们所关心 
的只是字母在传送中所占的百分比，而不再区别到底是哪一个字 
母，则我们可以把出现字母当作是成功，出现其他符号一律当作 
是失败，这时就可以把问题看作伯努利试验.同样地，电子管的 
寿命可以是不小于0的任一数值，但是有时根据需要，我们可以 
把寿命大于5000小时的电子管当作合格品，其余都作为次品.那 
么，这类问题还是可以归结为伯努利试验.这种例子可以举出不 


少. 

在伯努利试验中，首先是要给出下面概率 . 

P { A ) = p 9 PCA)=q (2.3.1) 

显然 ^>0，且 p 十 q = 

现在考虑重复进行《次独立的伯努利试验，这里的“重复”， 
是指在每次试验中事件从而事件 Z 出现的概率都保持不变. 
这种试验称为 《重伯努利试验， 记作丑”. 

总之，《重伯努利试验有下面四个 约定： 


( i ) 每次试验至多出现两个可能结果 之一： A 或 

( ii ) A 在每次试验中出现的概率/»保持 不变； 

( iii ) 各次试验相互独立； 

( iv ) 共进行 n 次试验. 

下面先给出《重伯努利试验的概率空间. 
n 重伯努利试验的样本点 形如： 



(2. 3. 2) 


其中叫是凡或瓦，分别表示第/次试验中出现 A 或：?，显然这 
种样本点共有2” 个，这是一个有限样本空间 • 

像对所有有限样本空间一样，可以把样本点的任意子集作为 
事件，构成事件域，不过在这个场合一般不用明显写出. 
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为了给定概率，只要利用试验的独立性和通过 （2.3. 1) 给定 
了户，就能给出形如 （2.3.2) 的样本点的概率，从而也就给定了 
所有事件的概率.例如 （ A ， ，…， A ) 表示前 《_1 次 
试验均出现事件 A 而第《次试验出现事件这是一个样本点， 
其概率为一般，若一个样本点中， A 出现 yU 欠，因而万出 
现 《 — 々次，则其概率均为 P k q n k ,跟 d 及万出现的顺序无关. 

为书写方便起见，上举样本点将简记为 A 八 ••• A - 其余 
的可以类推. 

有时也需要考虑可列 重伯努利试验 £^的场合，这时样本点 

形如 

(叫， £ ti 2 ， …， o » n ，…） （2.3.3) 

其中〜 ，仍取 A 或 A ， 这时样本空间不再有限，甚至也不可列，事 
实上它可与[0, 1] 区间进行一一对应，对这种试验就不能把样 
本空间的任意子集都看作事件. 

伯努利试验是一种非常重要的概率模型，它是“在同样条件 
下进行重复试验” 的一 种数学模型，特别在讨论某事件出现的频 
率时常用这种模型.历史上，伯努利概型是概率论中最早研究的 
模型之一，也是得到最多研究的模型之一，在理论上具有重要意 
义 ；■ 另一方面，它有着广泛的实际应用，例如在工业产品质量检 
査中，在群体遗传学中它都占有重要地位.在我们这门课程中 ，一 
些较为深入的结果也是结合伯努利概型进行讨论的. 

二、伯努利概型中的一些分布 

r 

下面我们计算伯努利概型中所出现的一些事件的概率，这些 
概率非常重要. 

1. 伯努利分布 

若只进行一次伯努利试验，则或是事件 z 出现，或是事件只 
出现，其概率由 （2.3.1) 给岀，称为 伯努利分布， 这是最简单的 
情况. 
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2. 二项分布 

我们来 确定〃 重伯努利试验中事件 a 出现&次的概率，这概 
率我们记之为 6( 幻〜， ). 

若以私记《重伯努利试验中事件 Z 正好出现々次这一事 
件，而以 A 表示第/次试验中出现事件 X ，以冱表示第次试验 
中出现万 ，贝 ! J 

B k ^A l A z ^-A k A k} 】… A + … +A { Ar^A n -- k A n .... k ^ r^A n 

(2.3* 4) 

右边的每一项表示 在某々 次试验中出现事件在另外^一々次试 

"I 一 

验中出现这种 项共有 j Ai 个、而且两两互不相容.由于试验的 

k / 

独立 ft 

PGU 2 ".4^H-r..^L)= J PU 1 )P(A 2 V.. J P(A t )/ > (^ +1 ) 

^•P(A n )=p k q n k 

(2. 3. 5) 

同理可得（2_3.4)中右边各项所对应事件的概率均为利 
用概率的可加性知 

P(B k ) - ( ^ ) p k q n - k 

i K / 


即 

n 

b ( k ； nj p ) ― u p k q n k ， 是= 0， 1， 2， …， 77 (2. 3* 6) 

' K I 

注意到 6(々；《，/>) ，6 = 0，1，2，…， w ， 是二项式(^― 
psY 展开式中？项的系数，因此 （2. 3. 6) 称为二 项分布 (binomial 
distribution ). 特别地 

n n ! . 

n , p ) = U [ (q + p) n = l (2*3.7) 

k ^ o k 4 、纪丨 

[例 1] 若在 w 件产品中有 A / 件废品，现进行《次有放回 

的抽样检查1问共抽得々件废品的概率是多少？ 

[解]有放回的，因此这 是”重 伯努利试验，若 

4砂 V 》 


* 



以 / I 记备次试验中出现废品这电件，则 

/二 PG1) 二 # 


因此所求的 概率为 

\ 


M\ 

N ) 


M 
k)\N 


M 

N 


这概率在第一章 § 3 中曾出现过. 

^ [例 2] 在群体遗传学中，假定可遗传的指标是依赖于基因 
的.基因总是成对出现并且具有两种型式4及 a 中的 一种. 假定 

P 

每一代具有 2 iV 个基因，则其中 A 所占的比例数 g 称为基因频 

率.基因频率的变化过程与群体的进化情况有着密切的关系. 

如果进行的是随机交配，也就是说任何个体有同样的机会和 
任何其他个体配种，则遗传学中对基因的遗传作下面 假定： 子代 

个体杲桉伯怒 利概型从卜一代毎个亲体—中 M 得某因 的. ~ 

因此若上一代的基因频率为 - 2 k ， 则下一代的基因频率为_ 
的概率由二项分布给出 、’ 


ZN f I i 

P, \ j ) i 2Ni r~27v) 

* 

在这个例子中基因频率 & 相当于伯努利试验中出现成功的 

概率户. 

3. 几何分布 

现在讨论在伯努利试验中首次成功出现在第々次试验的概 
率，要使首次成功出现在第々次试验，必须而且只须在前々一 1次 
试验中都出现事件2,而第々次试验出现4，因此若沿用推导二项 

分布时所用的记号4及瓦，则这事件（记为可表为 

W^'A.Ar'-Ak -iA, (2. 3. 8) 


利用事件的独立性，其概率为 

P(W i )^P(A 1 )P(A 2 )-P(A kl )P(A i )^q kl p 
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记 

gik-, p') ~q k ~ l p , 々=1，2，… （2.3.9) 

g U ; p) 是几何级数的一般项，因此 （2.3.9) 称 为几何分布. 这 
里有 

: JO Oo 

( 是； 户） — ^jQ h l p~P a — = 1 ( 2 . 3 . 10 ) 

Jfr=l A-] 1 

几何分布给出了等待事件 4 出现共等了々次的概率，这类概 
率在许多问题中出现，我们在第一章§ 3中曾遇到它.下面是一个 
模型化了的例子. 

[例 3] —个人要开门，他共有《把钥匙，其中仅有一把是 

能开这门的.他随机地选取一把钥匙开门，即在每次试开时每一 

把钥匙都以概率 | 被使用，这人在第 s 次试开时才首次成功的概 

率是多少？ 

[解]这是一个伯努利试验，> =丄，由 （2.3.9), 所求概 

n 

率为 



应当指出，讨论事件 a 的首次出现事实上牵涉到可列次伯努 
利试验，因此它的样本空间应取为 （2. 3. 3) 所表示的样本点全体. 
这个空间不是可列的，所以不能把它的一切子集都作为事件.在 
上述讨论中，我们只是把用 （2.3.8) 表出的作为事件，并以 
(2.3.9) 给出其概率，这里的事实上也包含了不可列个用 
(2.3.3) 表出的样本点.当然在讨论这个问题时，我们也可以干 
脆把作为样本点，这时样本空间取为 W 2 , W 39 …丨，并 
以 （2.3.9) 给出其概率，这就成了一个离散样本空间. 

下面讨论的是更复杂一点的情况，即巴斯卡分布，它可以看 
作几何分布的一种推广. 

4. 巴斯卡分布 

考虑相继的伯努利试验，让我们考察要多长时间才会岀现第 
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r 次成功. 

若第 r 次成功发生在第 f 次试验，则必然有？>厂. 

我们以 C , 表示第 r 次成功发生 在第々 次试验这一事件，并以 
/ (ki r , p ) 记食 概率，发生当且仅当前面的 々一1 次试验中有 
r 一 1次成功，失■败~，而第々次试验的结果为成功，这些事 

件的概率分别为与/>,于是利用试验的独立性，得 

\ ^― 1 / 

到 一 


尸 （ G ) = 



f 




ik — V 
\ r—li 


P r q 


k 


即 


/ a ； r , p) 




k-l\ 

i r~l 


p r q k _ r 、 k 


t r+1 ， 


• t • 


(2. 3. 11) 


注意到 


tjo 


o 


rj p ) 

k = r 


S 


k 


k~l 
T — 1 j 


p r q k 


2 


/ >v S 

; —r 

1 = 0 

\ r — 1 j 

；-0 

\l 


( — 1 yp r g' 


p r (1 —' q) 




1 


(2, 3. 12) 




这里利用 了 推广的二项系数公式 




(-1V 


r + Z — 1、 


曠 



r , p) 称 为巴斯卡分布 .. 特别当 r = l 时，我们得到几 


何分布. 


巴斯卡分布与著名的分赌注问题有关.这个问题来源甚古，但 
直到德•梅尔向巴斯卡提出并导致巴斯卡与费马的通信，后又引 
起惠更斯 （ Huygens ) 的兴趣，才由他们三人分别给出正确答案. 
巴斯卡和费马在解题中归结到取胜的概率，而惠更斯则引入数学 
期望的概念.可以说这宣告了概率论这一学科的诞生. 
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分赌注 H 题人•总如 卜‘：中、 乙两个赌徒按某种方式 F 注赌博 • 
说定先胜/間荇将赢得全部赌注，但进行到甲胜 r 局，乙胜 •、• H 
( r < t , .v<0) 时，因故不得不中止，试问如何分配这些赌注才公 f 
合理？ 

有人建议用 Li 胜局数作比例分配赌注，即以 r: 〃来分配.但 
这种分法显然没有考虑到最终取胜的槪率.若以 n = t _ r 皮 m=t 
- 5分别记甲及乙为达到最后胜利所须再胜的局数，乂设甲在每 
局中取胜的概率为/>，我们便可以把分赌注问题归结为如 F 槪率 
问题： 在伯努利试验中，求 之前出 Z 的 g 
率. ' 〜 

若以记 I:述概率，则它为甲最终取胜的概率，那么赌注以 
P v J 1一舢分配是公 f : n 理的.巴斯卡和费马都在某种程度上达 

到这个结果. 

现在，若利用巴斯卡分布，则容易写出答案 

\ 乂 丨《 M - ■ 1 丨 

丨 , ' P (1 (2.3,13) 

- 1 ： \ k I 

或 

v \ f W \~ k- 1 'j 

/d: , \ P (f (23 14 ) 

ri ' k ! 

另外，容易证明，削 (”十 - 1 料 ；^却以史定 胜负. 因此 
甲为取得最终胜利 A ' ij 1 )!' 而 I :: L 必须在后继的 n + w . — 1局中至少胜《 
局.这样，利 W 二项分布吋以知道， ^ 



可以证明上述王个答案足…致的（习题 30). 

下面是与巴斯卡分布有关的另-个有名例子. 

[例 4] (巴拿赫火柴盒问题）数学家的左、右衣袋中科放有 
一盒装有 W 根火柴的火樂4,每次柚烟时任取么用一根.求发 
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现‘盒用光吋， 1 小•盘叙 r 根的概率. 

[解]费作户-^的怕努利试验，要左边空而右边剩 r 根 • 心: 

w 

该是左边摸 H AM . 1 ;欠（前； v T 次用去 TV 根火柴，最后一次发觉火 
柴盒是空的）， I 耵右边摸过 iV — r 次,这事件的概率为 

, 1 , : 2 A' -— t 1 \ 2A r u 

/|W —" 十 1; A 7 +l , -- I ^ i y 

■ 2 1 N / l 2 j 


对于右边先空的情况可同样考虑，因此所求的概率为 


U r 




/ 1 、 1 

( 2N~r\ 

2A - 1 ； N 1 1 0 



1 2 ) 


(iV i 




三、直线上的随机游动 

考虑轴上的一个质点，假定它只能位于整数点，在时刻/= 
0时，它处于初始位黄 a G 是整数），以后每隔单位时间，它总受 
到一个外力的随机作用，使位置发生变化，分别以概率/>及概率 
q 二 \— p 向正的或负的方向移动一个单位，我们所关心的是质点 
在时刻 t 二 n 时的位置.用这种方式描述的质点运动称为 随机游 
动. 

若质点4以在整个数轴的整数点上游动， 则称 这种随机游动 
为无限制随机游动. 若在某点^设有-个吸收壁，质点一到达这 
点即被吸收而不再游动，因而整个游动也就结束了，这种随机游 
动 称为在 d 点有吸收壁的随机游动. 此外还可以考虑带 有反射壁 

在一个随机游动中还可以具有不止一个壁. 

当/二+时，随机游动称为对 称的， 这时质点向左或向右 
移动的可能性相等. 

自然科学中的大量问题归结为随机游动问题，例如随机游动 
模型可以作为布朗运动的初步近似. 股票价格涨落和汇率变化晕 
否具有随机游动特征，更是现代金融界最充满火药味的论争之一 . 
概率论中的 一些击 典问题也引导到随机游动问题，事实上，随机 
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游动可以看作是伯努利试验的一种描述法. 

关于随机游动，已进行过许多研究，我们只介绍它的两个最 
简单的模型. 

无限制随机游动 假定质点在时刻0从原点出发 ，以& 记它 
在时刻 t = n 时的位置.为了使质点在时刻 t = n 时位于岭， (6 也可 
以是负整数），必须而且只须在前 n 次游动中向右游动的次数比向 
左游动的次数多々次，若以 I 记它在前《次游动中向右游动的次 
数，： V 记向左移动的次数，则 



即因为 * r 是整数，所以々必须与 n 具有相同的奇偶性. 
事件{又=幻发生相当于要求在前《次游动中有 f 次向右， 

_次向左，利用二项分布即得 

{ 

n 

P } — n~\~k 



当走与 《奇偶性相 反时， 概率为 0. 

两端带有吸收壁的随机游动 假定质点在时刻 

x = a , 而在 x =0 及 x — a + b 处 各有一个吸收壁，我们来求质点在 

x^rb ^吸收的概率.用的是差分’方程法. 
若以 q n 记凰点的初始位置为«而最终在 a ^- b 点被屋 收的概 
率.显然' ; 


q 0 — 0^ q a ^t=l (2* 3. 16) 

如果某时刻质点位于 x ==/ l ， 这里1，则它要被 
x = a ~^ b 吸收，有两种方式来实 现：一 种是接下去一次移动是向右 
的而最终被 吸收； 另一种是接下去一次移动是向左的而 
最终被吸收.所以按全概率公式有 
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q n = pqn+i-^rqq n -\ » n = l ， 2 ， …， a~\-b—\ (2.3.17) 

这样，我们得到了 关于％ 的一个二阶差分方程 （2. 3 . I 7 )， 再 
用边界条件 （2.3.16) 就可以 求解. 利用这个差分方程系数的特 
殊性，比较方便的解法是把 （2.3.17) 改写成 

piq n ^ x —q„)=q(qn—qn-i)^ m = 1 ， 2 ，…， a-\-b~\ 

c „= q n + i — q„j r ，则又能写成 

t„ = rc n -i * w = l ， 2 ， … ， a~\~b— 1 

下面分两种情况 求解： 

( i ) r -1, 也即对称随机游动的场合.这时 

^ = 因此，若记 

q n +「qn = <h — qn—\^” = qi—qQ = d 

则 

qn=qo+nd 

由于9。=0， q a ^ b = l ^ 故有 


特别地 


— n 

qn= ^+i 


Qa = aTb 

( ii ) r^l , 即/的场合. 

这时 

c n =^0—] 2 =… ^r n Co 


(2.3. 18) 


从而 

n — 1 

Qn — Qo~ — 9 *) 

k=Q 

由于<?。= 0，= 故有 


n- 1 


^ S ^ = 

Jt-0 




因此 
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持别地 


q. 


. 



n 





(2. 3. 19) 


若以 A 记质点自〃出发而在0点被吸收的概率，同样可以列 
出差分方程 

Pn= ppn \ X^rqpn I ^ U = \j 2 , …， <2 + 6 — 1 


及边界条件 


Pi) 二 1 ， 户 


0 


类似地可以求得, 


P = <i 


时 


Pa 


h 


a+h 


而在 P 本 q 的场 


合 


1 


Pa 


P 

h 

i q ' 

a 

f q 

(1 / 


i P 1 


Pi 




1—— 


t 

q 


u-\- b 


1 


R_ 

\ P / 


-- b 


(2. 3. 20) 


(2. 3. 21) 


不管在什么场合，都有 

pa ~\- qu ~\ 

也就是说随机游动的质点最终一定要被两个端点之一所吸收. 
注意， （2. 3. 18) 及 （2.3.20) 也可以通过 （2. 3. 19) 及 

(2.3.21)，令/ v 用洛必达法则而得到 • 

顺便指出，两端有吸收壁的随机游动与概率论发展史上有名 
的赌徒输光问题有密切联系.这个问题是这样叙述的 ：甲、 乙进 
行赌博，其赌本分别为《及/>，若每局赌注为1，而甲、乙在每局 
中赢的概率分别为7,及试求甲（或乙）把赌本输光的概率. 
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四、推广的伯努利试验与多项分布 


二项分布可以容易地推广到〃次重复独立试验且每次试验 N 

能有若干个结果的情形.把每次试验的可能结果记为 A ，烏，…， 
A r ,而 P ( A ) :二 p 卜 / = 1，2，…， r ，且 

/v+ Z^ 十 … +/v 二 1 ， pi^O (2* 3- 22 > 

当 r =2 吋，我们得到伯努利试验. 

在这种推广的伯努利试验中，不难导出，在《次试验中4出 
现 t 次，及出现 t 次，…… A 出现怂次的概率为 


"! 


^1 1 k 


这里 k 〖 々! +々， 


參夸華 


k 、- 


k r 


Pl [ p 2 2mmm pt 


r 


(2. 3 


o 


公式 （2. 3.23) 你为多项分布，因为它是 （/ m +/^ + …十户 
的展开式的一般项，而且由 （2.3. 22) 知 



k ^ - \■- A r * ! k - ■ n 
1 l - 



々 1 ! 々 z ! 



(2. 3. 24) 


显然多项分布是：.项分布的推广.二项分布中的许多结果都 
能平行地推广到多项分布的场合，以后我们只详细讨论二项分布 
的有关问题. 

在产品检查中，若对产品质量所用的标准不只是好品与废品， 
而是分得更细，例如有一等品，二等品，三等品，等外品四类，则 
从中取出《件，求 一 等品有々 I 件，二等品有々2件，三等品有々3件， 

等外 品有匕 件的概率时便得到多项分布. 

[例 5] 人类的血型分为0, A ， B ， AB 四型，假定某地区 
的居民中这四种血型的人的百分比分别为 0.4, 0.3, 0. 25, 0. 05. 
若从此地区居民中随机地选出5人，求有两个为 O 型，其他-1个 
分别是 A ， B ， AB 型的概率. 

[解]推广的伯努利试验可以用于这个场合，所求的概率为 


争 
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尸 hAt- 11 x0 . 4 2 X0. 3X0. 25X0. 05 = 0. 036 

也可以研究平面上或空间的随机游动，下面是简单的一例. 
[例 6] (平面上随机游动）一质点从平面上某点出发，等可 
能地向上，下，左，右方向移动，每次移动的距离为1，求经过2« 
次移动后回到出发点的概率. 

[解]这可以归结为上述推广的伯努利试验的问题，分别以 
事件 A ， 木，土， A 4 表示质点向上，下，左，右移动一格，则 

若要在2«次移动后回到原来的出发点，则 


向左移动的次数与向右移动的次数应该相等，向上移动的次数与 
向下移动的次数也应该相等.而总移动次数为2«,因此所求概率 
为 


2 


(2 n ) 




n ⑷ ) 2 { m \ ) 2 ( 4 ) 


n 




(2 n)i 


(k\yidn-k)iy\ 4 



1 \ 2n (2n)l yy 

4 ] 


n\ 




1 (n — k )] 


1 ) 

2« 

f 2 n \ 

n 

( n \ 

4 j 


i n 

^Li 

k =0 



最后一个等式用到 （1.3.7). 



§4. 二项分布与泊松分布 


一、 二项分布的性质芨计» 



在上一节中我们导出了在《次伯努利试验中正好出现6次成 
功的概率 W ，/>): 


6( 是 ； n ， p ) — 



k — 0,1，2,…，《 


(2. 4. 1) 


其中 q =\ — p . 
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b(k ' t n ， p 、 ， 々 = 0 ， 1 ， 2，…， w 称 为二项分布， 在概率论中 
占有很重要的地位.由于在许多实际问题中出现二项分布，并見 
要计算其数值，因此讨论二项分布的计算显得非常重要. 

二项分布有现成的表可查，这种表对不同的《及户给出了 
bik ; n, p) 的数值. 

为了增加对二项分布的感性认识及计算的需要，我们选取了 
下列二项分布数值表. 

表 2. 4- 1 中给出了对于 n = W 及 p x ~0. 1, 々 2 = 0. 3, / >3 = 0. 5 
的二项分布数值表. 

二项分布表只对/ >< 0.5 给出，因为对于/ >> 0 . 5 的概率不难 
经下式计算 得到： 

h{k\n,p) = b{n — k；nA — p) ( 2 . 4 . 2 ) 


表 2 . 4. 1 二项分布數值表 


k 

b 

mamm 

■ 

b 







■ 

0 

0 . 1216 

0 . 0008 


11 

■ — - — - 1 

0-0120 

0. 1602 

1 

0 , 2702 

0 . 0068 


12 

— 

0 . 0039 

0 , 1201 

2 

0 , 2852 

0 . 0278 

0 . 0002 

13 

■* ~ — 

0.0010 

0 . 0739 

3 

0 . 1901 

0 . 0716 

0.0011 

14 

— —— 

0 _ 0002 

0 _ 0370 

4 

0 . 0898 

0 . 1304 

0 . 0046 

15 



0 . 0148 

5 

0 , 0319 

0,1789 

0.0148 

' 16 



0 _ 0046 

6 

0 . 0089 

0 . 1916 

0 . 0370 

17 



0 . 0011 

7 

0 - 0020 

0 . 1643 

0. 0739 

18 


— 

0 . 0002 

8 

0 . 0004 

0 , 1144 

0 , 1201 

19 



■ 

9 

0.0001 

0 . 0654 

0 . 1602 

20 

— 



10 


0 , 0308 

0 . 1762 






当/ >>0.5 时， 1 — #<0.5,仍能利用分布数值表.~ 

为了对二项分布的变化情况有个直观了解，我们把表 2.4. 1 
中的几个分布用图11表示出来 


从图中可以看出，对于固定的《及/>，当々增加时，6 (h «， 
p ) 先随之增加并达到某$大值，以后又 下降. 此外，当概率声越 






l: j I 接近时，分越接近付你 . 

" . ib{k-,20,p) 



[例 1] 一大批电 T 1 管中有10%已损坏，若我们从这枇电子 
管中随机地选取20只来组成一个线路，问这线路能正常工作（即 
所选的20个电子管全部是好的）的概率是多少？ 

[解]因为这批电 f 管数量很大，因此可近似地把选取20个 
管作为进行独立试验.这是一个伯努利概型问题，若把选得好电 
f 管作为成功.其概率为0.9,则所求的概率为 

/ 20 

A (20；20,( J . 9) = 0. 9 Z ° = 0. 

I 20 ； 

这个数值可以利用对数表计算，但更方便的是利用表 2. 4.] 
汁算，由（2.4.2)， 

b ( 20 i 20 , 0 . 9) -= /，（0;20,0. 1) 

利用表 2. 4. 】知所求的概率为 0. 1216. 

[例 2] (血清的试验）设在家畜中感染某种疾病的概率是 
30%，新发现了 一种血清可能对预防此病有效，为此对20只健康 
的动物注射这种血清.若注射后只有一只动物受感染，我们应对 
此种血清的作用作何评价？ 
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假如血清毫无价值，那么注射后的动物受感染的概率还是 
30%，则这20只动物中有 々只受 感染的概率为6 ( 幻20, 0.3). 

发生只有一只动物受感染 或更好的情况（无动物受感染） 的 
概率为 

办（0;20,0. 3) f ^(1;20,0. 3) = 0.0008 + 0.0068 = 0. 0076 

这个概率如此之小，因此我们不能认为血清毫无价值. 

如果注射后的20只动物中有4只受感染，我们是否相信此种 
血清有效？这个问题留给读者思考. 

这里的做 法是： 先依照我们关心的问题提出一个假设，然后 
用实验得出的数据，利用概率论方法，计算某个事件在假设成立 
下的概率，最后根据这概率的大小来决定是接受还是拒绝原来的 
假设，这是数理统计中有名的统计 假设检验法. 

2. 二项分布的性质 

我们来考察6 (々；《，/ ») 随 t 及《变化的情况.从图11可以 
看出，当《固定时，6 Oh «， /») 太二达到某一 

极大值后又逐渐下降.现在对它进 f 严格讨论. 

由于对0</><1， 

b{k\n^p) _ jn —々 + l)p _ (n + l)p — k 
b{k — 1 ； w ,/>) kq kq 

困此 

当 k < C .{ n ~\~ Dp 时 ， &(k ， p )^> b(.k — 1 ?«»/>) 

当 k = ( w + l)p 时，60;«，声）=办0 — 

当 k >( n-^\)p 时，/6(是 ;? 1，/>)<6(是一1 ; «,/)) 

因为 （n + l )/> 不-定 是整数，而二项分布 中的々 只取整数值， 
所以存在整数 m, 使得（” + 1) p - Km ^ (n + 1) />，而且当々 

从0变到《时，纟 n ， /0起先单调上升，当 A = m 时达到极大 
值，后来又单调下 降. 但若（《 + 1) / > = m 则这时6 ( m ; n , />) = 
f ; m — Un ， P ) 同时达到极大值. 

使 b ( k ; n ， p ) 取最大值的项 w ，/>) 称为办(点； n ，/>) 

• 89* 




的中心项， 而 m 称为 最可能成功次数. 由上面讨论知 [(«+ 

1) 户](即 W 是（《 + 1) 户 的整数部分）.若（《 + 1)户是整数，诹 
m -1 亦为最可能成功次数. 

[例 3] 设每颗子弹打中飞机的概率为 0. 01，问在500发子 
弹中打中飞机的最可能次数是多少？并求其相应的概率. 

[解]这是伯努利概型，打中飞机子弹数服从二项分布 . n 二 

500，/ > = 0.01, ( n - hl ) p =5.01 f [(« + 1) />] =5. 所以最可能 

成功次数为 5. 相应概率为 

/ 500\ 

办（5;500,0. 01) = (0. 01) 5 • (0. 99) 495 = 0. 17635 

I 5 / 

(2.4.3) 

应该注意，若0<><1，则当《值相当大时，即便是最可能成 
功次数 m 发生的概率也相当小，对于其他的々，则6 (h 77,/0自 
然更小了，以后将会看到最可能成功次数 m 发生的概率接近于、 

(2^npg)~i 

(当 n 相当大时），因此当⑺时，这概率趋于 0. 

3. 产品抽样验收与（《， c ) 方案 

由于生产过程总有种种无法完全控制的因素，因此工艺规范 
也允许加工的尺寸有一定的公差，或允许产品中含有少量废品，这 
事实上承认生产过程的随机性. 

在产品质量管理中，全面检验一般是不可能的，因此采用抽 
样检查的办法. 

抽样检验若用于生产过程中，则成为在线生产过程质量管理 
的一部分，此外就是用于产品的验收. 

如果每个产品要么是好品要么是废品，这时关心的是废品数 
或废品率，这是计数抽样验收中最简单的情况. 

对质量的要求大体上可以归结为 ：存在 />。及 A 满足 0< p 0 < 
^<1，当废品率/时，接收这批产品；而当 户 >九时，拒绝 

这批产品. 
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最简单也是最基本的验收方 案是： 抽》件产品进行检验，当 
废品数 :时， 接收该批产品；否则拒绝. 

这个方案称为 （/ I , C ) 方案. 

由于抽样的随机性，任何验收方案都可能犯两类 错误： 其一， 
拒收一批合格品；其二，接收一批不合格品.前者 为生产者风险; 
后 者为■消费者凤险 • 当然希望减小这两类风险，即 if 氏犯两类错 
误的概率.这也为比较两种不同'验收方案的优劣提供了客观的标 

准. 

为刻画验收方案的性能，一般引进 I (/>)， gg g 当废品_ 
为 户时，接收该 批芒晶 • 若 以 ( t >) 她兔 
标作图，贝 ! j 所得的曲线称为操作特性曲线 (operating characteristic 
curve )， 简称 OC 曲线（见图 12). 



图 12 OC 曲线 

对（《， d 方案而言，若抽样是放回的，则利用二项分布容易 

得到 


Lip) = 2 \ 户 *(1 — p、 n — k 

々= 0 \是/ 

因此，问题归结为找 jc ， 使得 

[Up) > 1 - a, 当户 </> 0 时 

这里〃，是两个不大的正数，按需要给定. 


( 2 . 4 . 4 ) 


( 2 . 4 . 5 ) 
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理想的验收方案要求 《=/?=0, 这是无法实现的，但可作为比 
较的基准. 

4. 应用的例子 

我们举一些应用的例子，说明二项分布的重要性，同时也提 
出一些问题. 

[例 4] 保险事业是最早使用概率论的部门之一.保险公司 
为了决定保险金数额，估算公司的利润和破产的风险，需要计算 
各种各样的概率.下面是典型问题之一.根据生命表知道，某年 
龄段保险者里，一年中每个人死亡的概率等于 0. 005,现有10000 
个这类人参加人寿保险，试求在未来一年中在这些保险者里面, 
(1) 有40个人死亡的 概率； （2) 死亡人数不超过70个的概率. 

[解]作为初步近似，可以利用伯努利概型，« = 10000, 
户= 0.005，设 P 为未来一年中这些人里面死亡的人数，则所求的 
概率分别为 

(1) b (40； 10000, 0.005) 

/ 10000 \ 

= (0. 005) 40 (0. 995) !,96 ° (2.4.6) 

\ 40 ) 

70 

(2) 70} = ^^ Ohl 0000,0. 005) 

A = o 

10000' t 

= (0. 005)*(0. 995) 10000- * 


(2.4.7) 

直接计算这些数值相当困难，要有更好的计算方法. 

[例 5] 甲、乙两容器，容量各为1升，每个各含 2.7 X 10 22 
个气体分子，现将两容器接触，经过相当长的时间后 

' 即这时每个分子落在两容器中的概率各为，求两容器中分子 

数之差超过分子总数的100亿分之一的概率. 

[解]分子总数为 5. 4 X 10 22 , 其一百亿分之一 （ B 卩 1( T 1<5 ) 为 
5.4 X 10 12 , 设混和后甲容器的分子数为则乙容器的分子数为 


參 
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5. 4 X 10 22 — p ， 现要求事件 

- (5. 4 X 10 22 — //) I > 5.4 X 10 u 

即事件 

\ ju - 2. 7 X 10 22 ! > 2. 7 X 10 12 (2,4.8) 

的概率，由二项分布 

P {\ m - 2. 7 X 10 22 | > 2. 7 X 10 12 } 

:= ^ hikib^A X 10 22 ,^) (2.4.9) 

h \ 乙 I 

上式和号对一切满足 I 々一2. 7 X 10 22 1 >2.7 XIO 12 的* 求和，这概 
率是无法直接计算的. 

从上面两个例子中可以看到，计算二项分布的数值时，由于 
试验次数《经常很大，因此实际计算6 (h n , />) 及 ^ b ( k in 9 p ) 

k 

都很困难，有时甚至不可能.例如 （2*4.9) 中须算的项数有 5. 4 
X 10 12 之多，逐项计算是不可能的. 

在这种情况下，寻找更有效的计算法是必要的，即便是近似 
公式也好.这可以利用概率论中的极限定理来实现，关于极限定 
理的讨论将在第五章 进行. 

二、 二项分布的泊松逼近 

在很多应用问题中，我们常常遇到这样的伯努利试验，其中， 
相对地说， n 大， />小，而乘积 A = n /> 大小适中.在这种情况下, 
有一个便于使用的近似公式，下面我们来推导它. 

定理 2* 4. 1 (泊松） 在独立试验中，以/代表事件/在试 
验中出现的概率，它与试验总数《有关，如 果 A ， 则当; t—oo 
时， ^ 


x k 

b(k ； n,p n ) 

〜-_ 

[证明] 记々=咏 ，贝 IJ 
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由于对固定的々有 


limA 


n 


AMim 


n. 


M 


卜 i 一 

n 


e 


A 


及 


lim 

卜 -i) 

h 2 ) 

« * * 

f k — 1\ 

1 - -~ - 

►cx) 

i n 1 

\ n J 


l n / 


因此 

A * 

\imbikin,p n ) = rye" A 

rt — ►tx ： i 


定理证毕. 

p{k^X) — = 0 ， 1 ， 2 ,… ( 2 . 4 - 10 ) 

称为泊 松分布 （Poisson distribution ) ， A 称为它的参数 • 

特别地 

= 2 A _ e _i — e _A • e A = 1 (2. 4. 11) 

*=0 

泊松分布是概率论中很重要的一种分布. 

在应用中， 当 士相 当 般当寸，我们用下面近 

似公式 

b(k'n ， p 、 免 <2.4. 12) 

[例 6] 假如生三胞胎的概率为 10- 4 ,求在100000次生育 
中，有0，1，2次生三胞胎的概率* 

[解]这可以看作伯努利试验；” = 100000, P = 0. 0001,所 

求的概率直接计算为 




ft 
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b(Oi 100000, 0. 0001) = 0. 000045378 
办（1; 100000, 0. 0001) = 0. 00045382 
b (2 - f 100000, 0. 0001) = 0. 0022693 

这时也可用泊松逼近， A =«/> = 10, 而 

p (0 i 10) = 0. 00004540 . 

p{U 10) = 0. 0004540 
/>(2? 10) = 0. 002270 

可见近似程度很令人满意. 

图13给出了泊松分布逼近二项分布的一个图示，吻合程度甚 
好. 

三、泊松分布 

在历史上泊松分布是作 
为二项分布的近似，于1837 
年由法国数学家泊松引入 
的.近数10年来，泊松分布 
日益显示其重要性，成了概 
率论中最重要的几个分布之 
一. 其原因主要是下面两 
点 • 

首先是已经发现许多随 
机现象服从泊松分布.这种 
情况特别集中在两个领域 
中 .一 是社会生活，对服务 
的各种要求，诸如电话交换台中来到的呼叫数，公共汽车站来到 
的乘客数等等都近似地服从洎松分布，因此在运筹学及管理科学 
中泊松分布占有很突出的地位；另一领域是物理科学，放射性分 
裂落到某区域的质点数，热电子的发射，显微镜下落在某区域中 
的血球或微生物的数目等等都服从泊松分布. 
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其次，对泊松分布的深入研究（特别是通过随机过程的研 
究）已发现它具有许多特殊的性质和作用，打个不很恰当的譬喻， 
似乎泊松分布是构造随机现象的 “ 基本粒子”之一. 

图14是对于不同 A 值的泊松分布图.为了计算泊松分布的 


数值，有许多专门的表格可供查用•本书附录二中也附有这样的 



图 U 泊松分布图 

下面提供两个有关的统计资料作为例子. 

[例 7] 对上海市某公共汽车站的客流进行调査，统计了某 
天上午10 : 30至11 : 47左右每隔20秒钟来到的乘客批数（每批 
可能有数人同时来到），共得230个记录，分别计算了来到0批， 
1批,2批,3批，4批及4批以上乘客的时间区间的频数，结果列于 
表 2. 4. 2中，其相应的频率与 A -0. 87的泊松分布符合得很好. 

表 2. 1 2公共汽车客淹统计 


頻数 


100 


81 


34 


230 




频率人= 


.43 


• 15 


04 


03 


，42 0 * 36 


16 


. 05 0 . 01 


_ 
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「例 8] 放射性物质放射出的 a 质点数是服从泊松分布的有 


名例子.1910年 Rutherford 等人的著名实验揭露了这个事实 • 

在适个实验中，观察了长为 7. 5秒的时间间隔里到达某指定 
区域的质点数，共观察了 2608次，表 2. 4. 3给岀观察值与理 

论值的对照，表示在#次观察中发生“在 7. 5秒内落到指定区 
域的质点数为的观察次数，理论值是 iV , U ; 3. 870)，理论值 • 
与实验值很近似. 

表2_4.3 Rutherford 实验理论值与实验值对照表① 


k 

N k 

N p (k ； 3,870) 

1 

0 

57 t i 

1 

54, 399 

1 

1 

203 

210.523 

2 

383 ' 

407* 361 

3 

i 

525 

1 

525* 496 

4 

532 

508. 418 

5 

晒 

1 

408 

393 - 515 

6 

273 

253.817 

7 

139 

140. 325 

8 

45 

67. 882 

9 

27 

29- 189 


16 

17. 075 

总计 

2608 

2608-000 


在说明了泊松分布的常见性之后，我们转入介绍产生泊松分 
布的机制.经过研究，已经弄清了服从泊松分布的条件.为了便 
于理解，我们将结合电话呼叫流来叙述这个重要结果. 


我们先证明一个以后屡次要用到的数学分析结论. 


①引肖费勒.概率论及其应用，离散空间（上册）.科学出版社 * 1964,第155 
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引理 2. 4.1 若 / Cr ) 是连续函数（或单调函数），且对一切 


，：V (或一切 y^O ) 成立 


f(x)f(y) —fix+y) 


(2. 4. 13) 


则 


fix) 


X 


(2* 4. 14) 


其中是某一常数. 


[证明]由 （2.4.13) 知对任意 


/ Cr ) 



>0 


因此/ Cr ) 非负.反复使用（2.4.13)，对任意正整数 n 及实数 : r 
有 ^ 




在上式中取 




，得 


/(I) 







/( I ) >0,则 



a 


因此，对任意正整数 m 及〜成立 




这样，我们已证得 (2.4-14) 对一切有理数成立，再利用连 
牲或单 调性可¥明刘 也成立 ,从而证明了引理. 
05^3§1^5^11^5^置的电话呼叫数，假定它具 
有下面三个 性质： 

( i ) 平稳性在0。，匕+£)中来到的呼叫数只与时间间隔长 
HFf 有婪而财 Jllfe 占 若以 A G ) 记在长度为 f 的时间 

区间中来 到&个 呼叫的概率，当然 


^>*(^)=1 


(2. 4_ 15) 


售 


98 
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对任何 /> o 成立 * 


过程的平稳性表示了它的概率规律不随时间的推移而改变- 
( ii ) 独 H 雲 无后效性）在[一 U + t ) 内来到々个 
呼叫这一事#^0寸¥[^以前发生的事件独立.换言之，在对时刻 
4以前的事件发生 情况所 作的任何假定之下，计算出来的在[^， 
G +0 内发生々个呼叫的条件概率都等于同一事件的无条件概率. 


独立增量性表明在互不相交的时间区间内过程进行的相互独立 


性. 


( in ) 在_莖分小的时 隔中，最多来到一个呼叫. 

即，若记《 


<pit)= 1 尸 *(/) = 1—Po(z)— 尸 】（/) (2 - 4- 16) 

k ^ 2 

应有 = o (0 , BP 

lim ^--=0 (2.4.17) 

普通性表明，在同一时间瞬间来两个或两个以上呼叫实际上 
是不可能的. 、 

下面我们求八 00. 

对 AC >0, #^_[0^ j + A £) 中来到是个呼叫的概率 g jj 叶 
Ar ), 由独立增量性及全概率公式 

二尸 *(0 尸。 ( 以）+ 尸卜 … 

+ 尸。 0) 尸 *( Ai) ,k^0 (2.4. 18) 

(对 ，假定 P - At ) = 0 .) 

特别地 

P 0 (t-\~^t)~P a {t)Po(At) (2.4.19) 

Po a ) 表示在长度为 f 的时间间隔中没有来呼叫的概率，因此它 
关于^单调下降，由引理 2-4.1 知 

(t) =a ( 

■■圓- ™ — — 

其中若^ = 0,则尸。00三0,这说明在不管怎么短的时间 
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间隔内都要来呼叫，因此在有限时间间隔中要来无穷多个呼叫，这 
种情形不在我们的考虑之列.此外，因 p 。 G ) 是概率，故应有 
«<1，而当 a = l 时，尸。 U ) =1,这表明永不来呼叫，也不是我 
们感兴趣的情形，所以应有 0< d < l ， 从而存在 A >0, 使 

PaCt ^ = g ^ (2. 4* 20) 

因此当时，我们有 

P 0 (A/) =e— 如 = 1 — AAf+o(Ai) 


Pi (Af) = 1 — 尸。 （ Af) —ip(At) — XAt-^oiAt) 

oo ^ °° 

Pk-iQ) =^(A/) =o(At) 

l = 2 1 = 2 

故由 （2.4. 18) 得 

P,{t+Lt)=P k U){\-X^t)+P k l {t) • AAt+o(At) 


因此 


jP A (f + Ai ) — P k { t ) 

Af 


k^l 

= A [ P A _ l a )- P *( t )]+ o ( l ) 


令 Ai— 0，得 


是 >1 


P . a ) = A [ F ,_ 1 (/)- P *(0], k^l 

由于已知尸。 （0= e —' 故有尸; （0= A [ e - 力一尸 〆 {)], 可解得 

P l ( t ) = Xte ^\ 这样下去，可解得一切 A ⑴. 


(XtV 

= \ 务= 0, 1，2,… 

这正是泊松分布，参数为 

在随机过程理论中，这里所得的结果及所用的方法将被大大 
推广. 


第二章小结 


_ 


本幸中我们讨论了（统计）独立性的概念，它 是橛率 论中最 
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重要的概念 之一. 独立性是概率论特有的概念，它的引进大大推 
动了概率论的发展，前期概率论中最重要的一些结果大都是在独 
立性的假定下获得的，只有到了近代才开始研究一些不独立但常 
在另一种较弱独立性假定下的概率模型.读者能在本书的后面部 
分充分体验到独立性的重要. 

我们定义了事件的独立性与试验的独立性，读者应把它们进 
行对比.此外，两个事件独立性的定义与多个事件独立性的定义 
形式上也有 区别， 应理解为什么会发生这种情况. 

条件概率是概率论中另一重要概念，它与独立性有密切联系， 
在不具有独立性的场合，它将扮演重要角色.条件概率也是某种 
概率. 

本章还导出几个基本 公式： 乘法公式及其推广形式，全概率 
公式，贝叶斯公式，它们以后经常被用到. 

伯努利试验是概率论中最重要的概型之一.正是通过对这个 
概型的不断深入地研究，逐漸提出了概率论特有的课题，创迨出 
相应的工具与方法.它对后来的发展有着不可估量的影响.伯努 
利试验概型在应用上也很重要.在第五幸，我们将继续讨论这个 
概型，证明有关的极限定理并最后解决一些本幸遗留的计算问題. 

二项分布与泊松分布是概半论中最重要的三个分布中的两 

个，另一个分布-正态分布，将在下章出现.这两个分布在理 

论研究和实际应用中都很重要.二项分布广泛应用于抽样检查，而 
泊松分布则大量出现于社会生活和物理现象中.泊松过程的结构 
分析是随机过程理论的最基本成果之一. 

到目前为止，本课程的展开基本上还是与概率论的历史发展 

相平行的，而且，我们已经为概率论另一重要概念-随机变 f 

的引入作了不少准备. 


习睡二 

1. 把字母 M, A 、 X 、 A 、 M 分别写在 - 一张卡片上，充分混和后重新排 
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列，问正好得到顺序 MAXAM 的概率是多少？ 

2. 有三个孩子的家庭中，已知有一个是女孩，求至少有一个男孩的概 

率. 

3. 若 M 件产品中包含 m 件废品，今在其中任取两件，求： （1) 取出的 
两件中至少有一件是废品的概率；（2> 已知取出的两件中有一件是废品的条 
件下，另一件也是废品的条件概率； （3) 已知两件中有一件不是废品的条件 

下，另一件是废品的条件概率. 

4. 证明： 对于事件 A ， £，关系式 

P z ( AB ) + P 2 { AB ) + P 2 { AB ) J rP z CA B ) = ^ 

4 

成立的充要条件为 

p(A)=pcb) = y^ P(AB)= \ 

5. 袋中有 a 只黑球，6只白球，甲、乙、丙三人依次从袋中取出一球 
(取后不放回），试分别求出三个人各自取得白球的概率. 

6. 甲袋中有 a 只白球，6只黑球，乙袋中有 a 只白球，#只黑球，某人 
从甲袋中任取两球投入乙袋，然后在乙袋中任取两球，问最后取出的两球全 
为白球的概率是多少？ 

7. 设有 W 个袋子，每个袋子中装有 a 只黑球，6只白球，从第一袋中取 
出一球放入第二袋中，然后从第二袋中取出一球放入第三袋中，如此下去，问 
从最后一个袋中取出一球而为黑球的概率是多少？ 

8. 飞机有三个不同的部分遭到射击，在第一部分被击中一弹或第二部 
分被击中两弹，或第三部分被击中三弹时，飞机才能被击落，其命中率与每 
一 部分的面积成正比，设三个部分的面积的 er 分比为0*1， 0.2,0.7. 若已 

中两弹，求击落飞机的概率- 

■9. 投硬币回，第一回出正面的概率为第二回后每次出现与前一次 
相同表面的概率为户，求第《回时出正面的概率，并讨论当《—%时的情况. 

10.甲、乙两袋各装一只白球一只黑球，从两袋中各取出一球相交换放 
入另一袋中，这样进行了若干次.以 A ， A ， ^分别记在第《次交换后甲袋 
中将包含两只白球、一只白球一 H 黑球、两只黑球的概率 • 试导出 
「, +1 用心，^表出的关系式，利用它们求 q …， 的表达式，并 
i 寸论当时的情况. 
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11. 设一个家庭中 有《个 小孩的概率为 



这里0</><1，00<¥，若认为生一个小孩为男孩或女孩是等可能的，求 

P 

证一个家庭有* ik > l ) 个男孩的概率为 2 a/>V i 2~ p ) k+ \ 

12. 在上题假定 F : (1) 已知家庭中至少有一个男孩，求此家庭至少有 
两个男孩的概率； （2) 已知家庭中没有女孩，求正好有一个男孩的概率. 

13. 已知产品中96%是合格的，现有一种简化的检査方法，它把真正的 
合格品确认为合格品的概率为0_ 98,而误认废品为合格品的概率为 0* 05,求 
以简化法检査下为合格品的一个产品确实是合格的概率. 

14. 炮战中，在距目标250米，200米，150米处射击的概率分别为 a 1, 
0.7, 0.2,而在各该处射击时命中目标的概率分别为0.05, 0_1， 0.2, 现在 


已知目标被击毁，求击毁目标的炮弹是由距目标250米处射出的概率. 


15. 在通讯渠道中，可传送字符 AAAA , BBBB , CCCC 三者之一，假定 


传送这三者的概率分别为0.3, 0.4, 0.3, 由于通道噪声的干扰，正确接收 


到被传送字母的概率为 0.6, 而接收到其他字母的概率是0.2,假定前后字母 
是否被歪曲互不影响，若接收到的是 ABCA ， 问被传送的是 AAAA 的概率. 
16-设九 B ， C 三事件相互独立，求证 AUS , AB , A-B 皆与 C ’ 独立, 
17. 若 A ， B ， C 相互独立，则 Z ， S ， C 亦相互 独立. 

*18. 证明： 事件 A , ，…， A 相互独立的充要条件是下列 2 rt 个等式 


成立: 


P (先爲…凡 ） =P Ui ) P ( i 2 ) … P iA n ) 


其中 A 取 A 或 A . 

19. 若 A 与 JEf 独立，证明 {0, A , ：?，中任何一个事件与 {0, B , 
B , Q ) 中任何一个事件是相互独立的. 


20. 对同一目标进行三次独立射缶，第一，二，三次射击的命中概率分 
别为0_ 4, 0. 5, 0. 7,试求 （1) 在这三次射击中恰好有一次击中目标的 概率; 
(2) 至少有一次命中目标的概率， 

21- 设 A ， …，土相互独立，而 F ( A >) = 外， 试求： （1) 所有事 
件全不发生的概率， •（2) 诸事件中至少发生其一的概率； （3) 恰好发生其一 
的概率， 
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22. 当元件尺或者元件尺 i 及尺 z 都发生故障时电路断幵，元件尺发十 
故障的概率等于0.3,而元件 /Cu 发生故障的概率各为0.2,求电路断开 
的概率. 

23. 说明“重复独立试验中，小概率事件必然发生”的确切意思. 

24. 在第一台车床上制造一级品零件的概率等于0.7,而在第二台车床 
上制造此种零件的概率等于0.8,第一台车床制造了两个零件，第二台制造 
了三个零件，求所有零件均为一级品的概率. 

25. 设实验室器皿中产生甲类细菌与乙类细菌的机会是相同的，若某次 
发现产生了 2«个细菌，求 （1) 至少有一个甲类细菌的概率； （2) 甲、乙两 
类细菌各占其半的概率. 

26. 掷硬币出现正面的概率为/>，掷了《次，求下列概率： （1) 至少出 
现一次正面； （2) 至少出现两次正面. 

27•甲、乙、丙三人进行某项比赛，若三人胜每局的概率相等，比赛规 
定先胜三局者为整场比赛的优胜者，若甲胜了第一、三局，乙胜了第二局，问 
丙成为整场比赛优胜者的概率是多少？ 

28. 甲、乙均有 n 个硬币，全部掷完后分别计算掷出的正面数，试求两 
人掷出的正面数相等的概率， 

29. 在伯努利试验中，事件 A 出现的概率为/>，求在《次独立试验中事 
件 A 出现奇数次的概率. 

# 3 o . 在伯努利试验中，若 a 出现的概率为户，试证在出现 m 次； i 之前出 
现《次3的概率，可由（2_3. 13)，（2.3.14)， （2.3.15) 中的任一形式表出， 

即它们是相等的. 

31. 甲袋中有 W — 1只白球和1只黑球，乙袋中有 W 只白球，每次从屮、 
乙两袋中分别取出…只球并交换放入另一袋屮去，这样经过了《次，问黑球 
出现在甲袋中的概率是多少，并讨论^+03时的情况. 

32. —个工厂出产的产品中废品率为 0.005, 任意取来1000件，试计算 
下面概率： （1) 其中至少有两件 废品； （2) 其中不超过5件 废品； （3) 能以 
90%的概率希望废品件数不超过多少？ 

33. 某主机有20个终端 ，这 些终端被各单位独立操怍，使用率各为0.7, 

求有10个或更多个终端同时操作的概率. 

34. 设每次射击打中目标的概率等于0.001，如果射击5000次，试求打 

中两弹或两弹以上的概率. 
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35. 某厂长有 7 个顾问，假定每个顾问贡献正确意见的百分比为 0.6, 现 

为某事可行与否而个别征求各顾问意见，并按多数人的意见作出决策，求作 
出正确决策的概率. 

36. 实验室器皿中产生甲、乙两类细菌的机会是相等的，且产生 々个细 
菌的概率为 



1，2，… 


试求： （1) 产生了甲类细菌但没有乙类细菌的 概率； （2) 在已知产生了细菌 


而且没有甲类细菌的条件下，有2个乙类细菌的概率. 


37. 假定人在一年365日中的任一日出生的概率是一样的，在50个人 
的单位中有两个以上的人生于元旦的概率是多少？ 

38. 一本500页的书，共有500个错字，每个字等可能地出现在每一页 
上，试求在给定的一页 h 至少有三个错字的概率. 

39- 某商店中出售某种商品，据历史记录分析，每月销售量服从泊松分 
布，参数为7,问在月初进货时要库存多少件此种商品，才能以 0.999 的概 
率充分满足顾客的需要， 

40. 螺丝钉生产中废品率为0.015, R • 盒应装多少只才能保证每盒中 
有100只以上的好螺丝钉的概率不小十80% (提示： 用泊松逼近，设应装100 


十走只） * 

41. 某疫苗中所含细菌数服从泊松分布，每1毫升中平均含有…个细 
菌，把这种疫苗放入5只试管中，每试管放2毫升，试求 ： （1) 5只试管中 
都有细菌的概率； （2) 至少有3只试管中有细菌的概率. 

42. 通过某交叉路口的汽车流可看作泊松过程，若在- - 分钟内没有车的 
概率为0.2,求在2分钟内有多于一车的概率. 

43. 若每条蚕的产卵数服从泊松分布，参数为 A ， 而每个卵变为成虫的概 
率为户，且各卵是否变为成虫彼此独立，求每蚕养活 A 只小蚕的概率. 

44-若已知 r = 0 时，某分子与另一分子碰撞，又知对 任何/ >0和 A /> 
0,若不管该分子在时刻，以前是否遭受碰撞，在（/， / + A /) 中遭到碰撞的 
概率等 f （~)，试求该分子在时刻 r 还没有再受到碰撞的概率. 

45. 利用概率论的想法证明 F 面恒 等式： 

h N + k\ 



**46. 通过构造适当的概率模型证明：从正整数中随机地选取两数，此两 

数互素的概率等于去. 

47. 某车间宣称自己产品的合格率超过99%，检验人员从该车间的 
10000件产品中抽查了 100件，发现有两件次品，能否据此断定该车间谎报 

合格率？ 

48. 产品验收方案 规定： 在一批 2 C 件产品中，抽取其中4件，若发现1 
件或0件次品，则接受此批产品.如果-批20件产品中含有5件次品，若依 
上述方案验收，试求这批产品被接受的概率. 

*49. 系统中每个元件正常工作的概率为/>，有半数元件正常则系统可工 
作，对什么 P 值， 2 i + l 个元件的系统比以一 1个元件的系统好？ 

*50. (赠券收集）食品厂把印有水浒 1 C 8 将之一的画卡作为赠券装入某 
种儿童食品袋中，每袋一卡，试求购买《袋这种食品而能收齐全套画卡的概 
率. 
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第三章随机变量与分布函数 


§ 1. 随机变量及其分布 

一、 随机变置的定义 


在随机现象中，有很大一部分问题与数值发生关系，例如在 
产品检验问题中，我们关心的是抽样中出现的废品数；在车间供 
电问题中我们关心的是某时刻正在工作的车床数；在电话问题中 
关心的是某段时间中的话务量，它与呼叫的次数及各次呼叫占用 
交换设备的时间长短有关.此外如测量时的误差，气体分子运动 
的速度，信号接收机所收到的信号（用电压表示或数字表示）的 
大小，也都与数值有关. 

有些初看起来与数值无关的随机现象，也常常能联系数值来 
描述.例如在掷硬币问题中，每次出现的结果为正面或反面，与 
数值没有关系，但是我们能用下面方法使它与数值联系起来，当 
出现正面时对应数“1”，而出现反面时对应数 “0”， 为了计算 n 次 
投掷中出现的正面数就只须计算其中“1”出现的次数了. 

一 般地，如果4为某个随机事件，则一定可以通过如下示性 
函数使它与数值发生 联系： 

= 1!， 如果 z 发生 
u= 10,如果4不发生 

这些例子中，试验的结果能用一个数 f 来表示，这个数^是随 
着试验的结果的不同而变化的，也即它是样本点的一个函数，这 
种量以后称为随机变量 (random variable ). 本书中将主要用希腊 

字母 $， W (，…来表示随机 变量. 下面我们就来考虑应当如何给 


* 
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这种量以严格的数学定义. 

正如对随机事件-样，我们所关心的不仅是试验会出现什么 
结果，更重要的是要知道这些结果将以怎样的概率出现，也即对 
随机变量，我们不但要知道它取什么数值，而且要知道它取这些 
数值的概率. 

从随机现象的可能出现的结果来看，随机变量至少有两种不 
同的类型. 一 秤是试验结果€所可能取的值为有限个或至多可列 
个，我们能把其可能结果一一列举出来，这种类型的随机变量称 
为离散型随机变置 • 在日常生活 中经常碰到离散型随机变量，例 
如废品数、电话呼叫数 等等. 前面讨论过的随机现象大部分都能 
用离散型随机变量来描述.例如古典概型中只有有限个可能结果， 
若对应于每-个结果用一个数值来表征，则得到一个离散型随机 
变量.又如在《次伯努利试验中，若以户记事件 j 出现的次数，则 
A 可取值0, 1，2,在呼叫流的研究中，若以 f 0) 记 
[0, Z] 中来到的呼叫数，则 f (f) 可取值 0, 1, 2, …这些都是 
离散型随机变量. 

从上章的讨论可以看到，要描述这类随机变量并不难，以《次 
伯努利试验中事件 Z 出现的次数 P 为例，我们知道它是样本点 ⑵ 
的函数，也就是说严格来讲，应写作 A U >)， 其中它取的 
值是0, 1，2,…，《，并且知道 " U 0 取这些值的概率为① 

n\ 

Pijuico^^k}— p k q n k ， 々 = 0 ， 1 ， 2,…， w 

k 


①下面出现记号 k h ) = k ) f 对于不熟悉这类记号的读者，我们作如下说明. 
> 二 i } 是 /> ( W ) — 的简写， 它 表示具有如下性质的样本点 a 的集合：在 
其上 p 取固定值 L 一般地，对于从样本空间 D 到数直线 R 1 上的单值映射$化)，若 
A 是 R 1 的某一子集，常以 K U) eA} 作为 {a f ( o 0 eA} 的简写，用来表示使 
f (^) 之值属于 A 的那些样本点 Oi 的集合，有时还进一步简记作(^)；特别地， 
< ix ) 即为 C X )}，这里 是某一实数. 
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这里我们已经知道了 " （⑴） 取什么值，以及以什么概率取这些值. 

一般地，別•于定义在样本空间 D 上的离散型随机变量只 
要能指出它取的值 A ，…， x „， …以及它取这些值的概率 

= 1, 2, 71 , …就满足了我们的 要求. 显然要做 

到这一点，必须要求 { Hco ) = x ,} 有概率.因为我们只对事件域 
$中的集合定义概率，所以必须有{⑴：=^} e 災. 

与离散型随机变量不同，一些随机现象所出现的试验结果 e 
不止取可列个值，例如测量误差、分子运动速度、候车时的等待 
时间、降水量、风速、洪峰值等等皆是.这时用来描述试验结果 
的随机变量还是样本点 w 的 函数： 严格写应是 fu )， 其中 o > en ， 
但是这随机变量能取某个区间[>， d ] 或 （一 oo , oo ) 的一切值. 

假如想用描述离散型随机变量的方法（简单地罗列所取的值 
及相应的概率）来描述这后一类随机变量，则会碰到很大的困难. 
一来是这类随机变量所取的值不能 一一 列出； 二来，我们下面将 
会看到，取连续值的随机变量，它取某个特定值的概率常常是0, 
因此用这种描述方法根本不行. 

对于取连续值的随机变量我们所关心的也并不是它取某个特 
定值的概率.例如在测量误差的讨论中，我们感兴趣的是测量误 
差小于某个数的概率；在降雨问题中，我们重视的是雨量在某一 
个量级，例如在100毫米到120毫米之间的概率.总之，对于取 
连续值的随机变量我们感兴趣的是 s ( W 取值于某个区间 
( a , b ) 的概率，或取值于若干个这种区间的概率.因此应当要求 
{<2<芒(<^)<3}或{$(0>)<6}或一 * 般地 {$(&>)63} (其中 d 是由区间 

经并、交等运算而得到的直线上的某一个点集）有概率可言，既 
然只对概率空间03, P ) 的事件域^中的集合才定义概率， 
因此我们自然要求上述集合属于，，即都是事件. 

通过上面讨论可以看出，为了使我们感兴趣的概率计算得以 
进行，我们应对 ⑽ 加上一定的限制，主要是要求 { a eM € 
应是事件.在离散型随机变量的场合， B 是直线上的某一个点；在 
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取连续值场合， B 是直线上由区间经并、交等运算而得到的某一点 
集.在概率计算中有时要考虑可列运算，因此较方便的是取 Z ? 为 
直线上博雷尔点集. 

为此引进如下 定义： 

定义 3. 1.1 设 $0) 是定义于概率空间 （ O , $， P ) 上的 
单值实函数，如果对于直线上任一博雷尔点集有 

芒 (o>) 65} €牙 (3.1.1) 

则称 SU ) 为随 机变量 （图15)，而 P { H < o ) eB ] 称为随机变量 

的概率分布. 

特别地，若取(― 的，1)， 则 _ B 

有 

{< w ： ^( w ) O } 6■叉 

(3. 1.2) 

因此 P {^) <^}有定义.注意到 

P{a =P {$((o)<Cb} 

-PiHwXa) 

(3. 1. 3) 图 15 随机变量 

所以只要对一切实数 x 给出概率 p { Hco ) < x ) t 就能算出$ (⑴ m 
入某个区间 [ a ， 纟）的概率，再利用概率的性质还可以算出芒 
( a >) 属于某些相当复杂的直线点集（譬如可列个不相交的左闭右 
开区间之和）的概率 • 

. 定义 3_ 1. 2称 

F(jr)~P{$(to)<ix} r —(3.1.4) 

为随机变量 的分布函数 (distribution function ). 

为书写方便起见，通常把“随机变量服从分布函数 
FG )” 简记作 〜 Fix ). 

由 （ 3.1.3 ) 立刻得到 

P(a))<.b} = F(b) ~F(a) (3-1.5) 

在上面讨论中，我们根据描述随机变量的需要给出了随机变 
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量与分布函数的定义.按定义，随机变量是样本点的函数，因此 
在试验前我们只能知道它可能取哪些值，而不能确知它将取何值， 
这就是随机性；但是到了试验之后，它的取值也就明确了。为了 
计算概率，必须要求随机变量具有可测性（3.1.1)，而分布函数 
的引进则把对于随机变量的概率计算化为对分布函数的数值运 
算.这样一来，我们已经在科尔莫戈罗夫的公理化结构中给随机 
变量予严格的定义，同时又为对它的研究准备了方便的分析工具. 

应该指出，最后之所以采用这种定义，还有数学理论上的需 
要，有些进一步的事实，例如若 （3.1.2) 成立则 （3.1.1) 也成 
立，由分布函数可以唯一决定概率分布等等是可以通过测度论的 
方法证明的，这些已超出本课程范围，我们将不予讨论. 

概率论是研究大量随机现象中的数量规律的数学分支，研究 
随机变量和分布函数是它的重要任务，而且概率论中所研究的也 
大都局限于能用随机变量来描述的随机现象.前面已指出，随机 
事件的研究可通过示性函数转化为对随机变量的研究，随机变量 
是取数值的，因此可以对它进行各种数学运算，研究起来就很方 
便. 

二、分布函数的性质 

我们先把分布函数的最基本的性质汇集于下列定理中. 

定理 3.1.1 分布函数 FCr ) 具有下列 性质： 

( i ) 单 调性 ： 若 a < b ， 则 FUXFOO ; 

(ii) lim J F(x) = 0 > lim Fix ) = 1 ； (3. 1. 6) 

jr — oo + oo 

( iii ) 左连续性： F ( x —0) 

[证明] ( i ) Fib ) - F ( a ) = P { a ^< b }^0. 

Oo 

( ii ) P {~ cx )<^< + oo }= S 

n= — oo 

oo 

= [F(/z + l) — F(n)] 




= lim F(n) — lim F(m) = l 

n m— — m 

由于 FU ) 的单调性， lim F (^) = lim F(m), lim Fix) - 

► ■_ O Fit ~► - - t'JO J—► + oo 

lim F ( w ) 存在. 

«—► + oo 

因为 ( KFCrXl , 故 

lim F(x) = Q ， lim Fix) — 1 

i - ►一 oo j 一 + ); 

今后为书写方便起见，将记 

F ( —lim FCr )， F ( + oo )= lim FU ) (3.1. 7) 

-- or> ► + oo 

( iii ) 由于 F ( x ) 是单调函数，只须证明对于一列单调上升的 

数列工 0< 工 1< 工 2<^“< 工《<…，成立 HmF (x„) ~F (x) IP 

n — ►⑴ 

可. 

因为 

；> ■- 

Fix) — F(x 0 ) — P{x 0 ^$<ix} = FCr„ —!)] 

rt : 1 

= \imF(x n )-F(xo) 

rt— c，j 

所以 

F(x~0) = limF(x„ )= Fix) 

可以看出分布函数的这三个基本性质，正好对应于概率的三 
个基本性质. 

有了分布函数，关于随机变量彡 （ oO 的许多概率都能方便算 
出，例如 

P{Hoj)=a}—F(a-\-0)—F(.a) 

P {$(co)^a} =F(“ + 0) 

P = 1 — F(a^> 

P{Hco)>a)^l-F(a-\-0) 

综上所述，分布函数是一种分析性质良好的函数，便于 处理; 
而给定了分布函数就能算出各种事件的概率。因此引进分布函数 
之后，许多概率论问题便简化或归结为函数的运算，这样就能利 
用数学分析的许多结果.这也是引进随机变量的好处之一. 
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可以 证明满足上述 定理中 三个性 质的函数必是某随机 变量的 
分布函数，关于这点的讨论将在第3节进行. 

对于随机变量及其概率分布的研究，若按随机变量的不同类 
型分别讨论是有好处的，下面我们将照此线索进行. 

三、离散型随机变置 


设 

A 的概率，即 


为离散型随机变量€的所有可 能值； 而/ >(1) 是6取 


/ > W = A }=/>(:*:,)，r = l ，2,3, … (3. 1. 8) 

{户0：,)，〗=1，2,3^}称为随机变量$的概率分布， 它应满足下面 
关系： 

i=l ， 2,3, … （ 3. 1. 9) 


y ^] p ( x t ) = 1 (3. L 10) 

i-l 

当给定了 { i ,， 卜 1，2，及 {/> (了,)， i = l , 2, … }， 我们就 
能很好地描述随机变量 L 因为我们已经知道了它取什么值，以及 


以什么概率取这些值，而这正是我们对随机变量所关心的问题. 


常用下面 方法来 表出离散型随机变量€的概率分布， 


义 1 了 2 … … 

) pix 2 ) … A(xJ … j 


(3. L 11) 


(3.1.11) 称为随机变量€的分 布列， 由分布列能一目了然地看出 
随机变量$的取值范围及取这些值的概率. 

有了分布列，可以通过下式求得分布函数 


F { x ) = P { ^ < ^ } = ^ p (^： k ) (3. 1. 12) 

显然这时 FCr ) 是一个跳跃函数，它在每个^处有跳跃度 /) Cr *). 
当然，由 FCr ) 也可唯一决定 j ：* 及 pix k ) ,因此用分布列或分布函 
数都能描述离散型随机变量. 

图 16( a ) 中显示 一个离散型随机变量的概率分布，而图16 
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( b ) 中则是它对应的分布函数 _ 


户 U.4 J 



tb ) 

图16离散型概率分布与分布函数 

下面看一些离散型随机变量及其概率分布的例子.这些分布 
大都在上两章引入过. ， 

[退化分布]若随机变量《只取常数值 G 即 

P{a^c) ― 1 

这时分布函数为 

(OfX^.c 

l(x — c)= r (3_ 1. 13) 

可以说，这样的《并不随机，但有时我们宁愿把它看作随机变量的 
退化情况更为方便，因此称之为退化 分布， 又称单点 分布. 

[伯努利分布]在一次试验中，事件 a 出现的概率为/►，不 
出现的概率为 g = i — 户， 若以卢 记事件4出现的次数，则/?仅取 

0, 1两值，相应的概率分布为 

b k = P{^~k}— p k q 1 ' k jk~0 yl (3. 1. 14) 
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这个分布称为 伯努利分布， 亦称两点 分布. 

[二项分布]在 〃重 伯努利试验中，若以 A 记事件 Z 出现的 
次数，则它是一个随机变量，户可能取的值为0, 1，2,…，；2,其 
对应的概率由二 项分布 给出： 

b(k;n^p) —P{ju = k}= \ p k q n ~ i 

\k 


是= 0，1，2，…， 《 • (3» 1, 15) 

简记作 ( w ， 户）. 

关于二项分布及其计算已在上章作过详细讨论，这里不再重 
复.至于为什么称为分布，到了此处自然十分明白. 

顺便指出，伯努利分布可以看作《=1时的二项分布，这时相 
应于一次独立试验的场合. 

[超几何分布]对某批 W 件产品进行不放回抽样检査，若这 
批产品中有 M 件次品，现从整批产品中随机抽出 n 件产品，则在 
这《件产品中出现的次品数 v 是随机变量，它取值0, 1，2,…， 
n ， 其概率分布为 起几何分布. 



■ 

=P {p—k } = 


IM\ IN~M) 

\k I [ n — k I 

iN \ 


Q 《 k 《 n《N 

k(M 


(3.1.16) 


这个分布在第一章中已经出现，我们还证明过当 AT 很大而 n 
较小时，它可用二项分布来近似. 

[泊松分布]若随机变量纟可取一切非负整数值，且 


P {$^= k \ = T ~ e ^ k ^ 是= 0，1，2，… （3.1.17) 

k l . 

其中;1>0,则称$服从 泊松分布. 简记作 f 〜尸 U ). 

泊松分布是概率论中非常重要的一个分布，在第二章§ 4中 
已对它进行过初步讨论，以后我们还会经常提到它. 

[几何分布]在事件4发生的概率为户的伯努利试验中，若 
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以 7 记 4 首次出现时的试验次数，则7为随机变量，它可能取的 
值为1，2，3，…其概率分布为几何 分布： 

gik p) ~ P {y)~k) —q k ^ x pi 々 = 1 ， 2 ,… （ 3 . 1 . 18 ) 

作为一种等待分布,我们在前两章中已多次碰到过几何分布， 
这也说明了几何分布是一种常见的概率分布.几何分布在概率论 
中的重要性，还在于它具有下面特殊的性质. 

几何分布的无记忆性 如上所述，在伯努利试验中，等待首 
次成功的时间々服从几何分布 （3. 1_ 18). 现在假定已知在前 m 次 
试验中没有出现成功，那么为了达到首次成功所再需要的等待时 
间 V ，其概率分布为 

P{yf = k ) ~ P {^= m^rk I } 

Pjrj ^ m -^ k ) _ q m+k ~ 1 p 
P { } q m 

~Q k ^p » 々 = 1 ， 2 ,… 

还是服从几何分布 （3.1. 18), 与前面的失败次数 m 无关，形象化 
地说，就是把过去的经历完全忘记了.因此无记忆性是几何分布 
所具有的一个有趣的性质. 

更加有趣的是，在离散型分布中，只有几何分布才具有这样 
一种特殊的性质.下面我们来严格叙述并证明这个事实. 

若？是取正整数值的随机变量，并且，在已知 V > k 的条件下， 
7=々+ 1的概率与々无关，那么？服从几何分布. 

这个论断的证明如下 ：以/ >记上述条件概率，并记％ =户{7> 
k } 及/ >* = 尸 { rj = k } ， 那么办一❼ +1 ，而且在已知?；>々的条 

件下，”=々+1的条件概率为因此 

Qk 


即 
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9k + 1 

<ik 


= 1 — p 



* * ft 


注意到 9。= 1， 那么 (1 — />)*， 因此 

/>* — (! — pY \ p ， k = \ » 2 » 

这正是几何分布 (3.1.18). 

[巴斯卡分布]在上例的伯努利试验中，若以 （记第 r 次成 
功出现时的试验次数，则 C 是随机变量，取值 r ， r 十1 ，…其概率 

分布为巴斯卡 分布： 

々~ 1 \ 

PW = k }= fq k r ， 々 = r ， r + l ， … （3. 1. 19) 

^ r —1 / 

这分布在上章 § 3 出现过.显然当时，即为几何分布. 

另一方面若以％记从第 〗_1 次成功之后的第一次试验算起 
至第/次成功为止共进行的试验次数，则7,服从几何分布 
(3. 1.18)，而且 


< =: 7i + …+ % (3, 1. 20) 

若记 r ， 则？表示为等待第 r 次成功所经历过的失败次 
数，那么， 

- r~\-l— 1 \ 

P{?=/}=F{^=r+/}= , fq r¥lr 

\ r — I / 

/ — ^ \ 

p r q l ― . 〆 （一，公，… 



(3.1.21) 

显然， C 与？只是计数方式的不同，一个记全部试验数（包括 
成功次数与失败次数），另一个则只记失败的次数，它们描述的是 
同样的随机模型. 

这样定义的概率满足非负性及 


严 


OO 


S 


p r (—qy=p r il—q)^ r = 1 

/ * 


因此 (3. L 21) 也表示一个概率分布，不少书上把这个分布作为 
巴斯卡分布的定义. 

特别地，取考察为等待第1次成功所经历过的失败次 

数那么， 
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P{y=l} / = 0 ， 1 ， 2 ，… （ 3 . 1 . 22 ) 

这也是一个分布，表示等待首次成功所经历过的失败数，也称为 
几何分布. 

有趣的是，等待第 r 次成功所经历过的失败次数也可作如下 
分解: 

?=7 lH - , 

其中$也服从分布 （3.1.22). 

总之，几何分布与巴斯卡分布都有两种表达式，本书采用前 
者，即（ 3 . 1.18) 及（3.1.19)，阅读参考书时务请注意. 

对巴斯卡分布，可以略加推广，即去掉 r 是正整数的限制，这 
便得到 

[负二项分布]对于任意实数 r >0, 称 

= | 'p'—qY ， / = 0 ， 1 ， 2 ,… 

(3. 1. 23) 

为负二项分布. 

从前面的推导过程中很容易看出这的确是一个概率分布，它 
的取名也很自然. 

负二项分布作为某些离散随机现象的数学模型，正在逐步引 
起人们的注意. 

四、连续型随机变 Jt 

除了离散型随机变量之外，还有一类重要的随机变量一-连 
统型随机变置.这种随机变量$可取某个区间1>， d ] 或 （一00, 
W ) 中的一切值，，而且其分布函数 FCr ) 是绝对连续函数，即存在 
可积函数/ >( x )， 使 

Fix) = p(y)dy (3. 1, 24) 

‘ — oo 

称 p (1) 为 S 的(分布）密度函数 (dlnsity function ). 
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显然 


(3. 1. 25) 


p{x) — F f (x) 

由分布函数的性质可知对 />(> r ) 应有 

p(x)^0 



p ( x)dx = 1 


(3, 1. 26) 
(3.L 27) 


反之，对千定义在（一 ㈤ ， cx >) 上的可积函数(: r )， 若它满 
足 （3.1.26) 及（3.1.27)，则由 （3.1.24) 定义的函数 F ( x ) 是 
一 个分布函数，即它有分布函数所必须具备的三个性质. 

顺便指出，由于在若干个点上甚至一个零测集上改变被积函 
数/ >( x ) 的值，都不影响积分之值，因此，关于 /> U ) 的论 
断通常都是在“几乎处处”的意义上成立，今后不再 一一 提及. 

由 （3.1.5) 立刻得到 

P {a 《爸 b ) = F ( b ) — F ( a ) = p ( x)dx (3* 1* 28) 

J a 

因此给定密度函数，便可以算出随机变量落入某一个区间的概率. 
下面计算因为 



P{^=t} = 0 (3.1.29) 

即连续型随机变量取个别值的概率为0,这与离散型随机变量截 
然不同.因此用列举连续型随机变量取某个值的概率来描述这种 
随机变量不但做不到，而且也毫无意义. 

此外，上述结果还表明，一个事件的概率等于零，这事件并 
不一定是不可能事件；同样地，一个事件的概率等于1，这事件也 
不一定是必然事件. 
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由于在/的连续点 T 处， 


p { x)Ax ^ p ( y)^y = F (: r + Ar ) — Fix ) 


(3. L 30) 

因此密度函数/> Cr ) 的数值反映了随机变量取的邻近的值的概 
率的大小.所以用密度函数描述连续型随机变量的概率分布在某 
种意义上与离散型时用分布列描述，又有相似之处. 

下面举一些常见的连续型分布的例子. 

[均匀分布]若 a ， 6为有限数，由下列密度函数定义的分布 
称为[“，^]上均匀 分布： 


p { x ) = <b — a 

、 0, 


a 《 jc 《b 
工 < a 或 a 〉办 


(3. 1.31) 


相应的分布函数为 

0, x 

Fix ) = a < x^b (3. 1,32) 

b — a 

.1 ， x>b 


[ a , 6] 上均勻分布有时简记作 "|>，6]. 

若随机变量$服从[〃， 6] 上均匀分布，则$在 [ a ，6] 中取 


值落在某一区域内的概率与这个区域的测度成正比.粗略地讲就 
是， f 取 [ a ，6] 中任一点的可能性一样.当然也可以反过来看， 


均匀分布正是把这种直观的讲法严格化. 


图17画出了 [心 6] 上均匀分布的密度函数及分布函数 • 


[例 1] 定点计算中的舍入误差可以作为常见的均匀分布随 
机变量的例子.假如我们在运算中，数据都只保留到小数点后第 
五位，而小数点第五位以后的数字按四舍五入 处理. 若以 x 表示 
真值，以土表示舍入后的值，则误差£=工一土一般假定为 
[一 0. 5 X 10- 5 , 0.5 X 10- 5 ] 上均匀分布的随机变量，有了这个假 
定，就能对经过大量运算后的数据进行误差分析，这种误差分析 
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在用数字计算机解题时是很必要的，因为数字计算机字长总是有 
限的 • 



图17均勻分布的密度函数与分布函数 

[正态分布]密度函数为 

• p(x) = ，一 oo<z<oo (3* 1* 33) 

其中 (T>0, ^与^均为常数，相应的分布函数为 

/ \ 1 J (y—a) 2 . 

^ (i) = ―― e w dy，一 oo < x < oo (3, 1. 34) 

v 2 ⑽厂 。0 

这分布称为正 态分布 （normal distribution ) ,简记为 ，《 r 2 ). 

特别当^ = 0, ^7=1, 这时分布 称为标准正态分布， 记为 

〜(0，1)，相应的分布密度函数及分布函数分别记为〆I)及 4> (x) ， 
见图18及图 19. 

/、 1 

= T, — oo< x <oo (3. 1. 35) 

1 ^ 

< p { x ) = —— e ~ zdy , — oo < x < c» (3.1.36) 

/2 tt j 

习惯上把服从正态分布的随机 变量称为正态 变置. 可 以验证，若 
随机变量$服从正态分布 N ( a , a z ) 9 简记作$ 〜 AKa,a 2 ) ， 则随机 

变量7 = > 服从以(0，1). 

为了说明 C3. 1.33) 确实定义了一个密度函数，需要验证关 
系式 （3, L26) 及（3.1.27)，显然 

户（工）>0 
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图 18 正态密度函数 p U ) 


0{x) 
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图19正态分布函数0 Cr ) 






从而完成了（3.1.27> 的验证. 

正态分布是概率论中最重要的分布. 一 方面，正态分布是自 
然界最常见的一种分布，例如测量的 误差； 炮弹弹落点的分布；人 
的生理特征的 尺寸： 身高，体重等 f 农作物的收获童；工厂产品 

的尺寸：直径，长度，宽度，高度； 都近似服从正态分布. 一 

般说来，若影响某一数量指标的随机因素很多，而每个因素所起 
的作用不太大，则这个指标服从正态分布，这点可以利用概率论 
的极限定理来加以证明.另一方面，正态分布具有许多良好的性 
质，许多分布可用正态分布来近似，另外一些分布又可以通过正 
态分布来导出，因此在理论研究中，正态分布十分重要. 
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一般正态分布密度函数/ >( X ) 的图形见图 20, 通过图形或 
(3. 1. 33) 不难 看出： 在 x = a 处达到极大，整个图形关于 ■xza 
对称.当 cr 不同时，的形状也不同，<7越小，分布越集中在 x 
附近； 当^7越大时，分布就越平坦. 

由于正态分布在概率计算中的重要性，已编造了各种各样的 
正态分布表，本书的附表中就有 a =0, <7=1时的正态分布密度函 

数和正态分布函数 0( sc ) 的表.由于 私一工、=^>(工、及0(—工') 
=1 — 所以表中只对正的 x 给出 pU) 及少 U) 的数值 .一 
般的分布函数值可由变换而得 



图20 <* = 0 且具有不同的 V 的正态密度曲线 

ir( x ) = 0( (3.1.37) 

\ ^ I 
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从表中可以看出，若 f 服从 AKa ，/)， 则 

P { |^-«|<( t }^68. 27% (3. 1. 38) 

P { a |<2a} 々 95. 45% (3. 1. 39) 

P { |f-a|<3tr}^99. 73% (3. 1.40) 

因此可以说，在一次试验里， $ 几乎总是落在 a + 3 a ) 
之中. 

下例说明正态分布与实测数据符合得很好. 

[例 2] 某手表厂曾对其生产的某个零件的重量收集了大量 
资料，对测量得的3805个数据，桉不同重量加以分组，并记录了 
不同范围内零件的个数（频数），计算了它们的频率，结果如下表 
所示，它们与 a = 56.94, 2的正态分布符合得相当好，图21 

表示了两者符合的情况. 


0. 04 

0. 03 

0 . 02 

0. 01 

39.5 43.5 47. 5 51,5 55,5 59.5 63- 5 67* 5 71- 5 

图21实测数据頻率直方图与正态密度曲线 
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(— oo , 41. 5) 
[41. 5，43_ 5) 
[43. 5， 45- 5) 
[45* 5， 47-5) 
[47. 5, 49 - 5) 
[49 - 5* 50. 5) 
[50- 5， 51. 5) 
[51- 5, 52. 5) 
〔52_5， 53.5) 
[53. 5, 54- 5) 
[54 - 5, 55.5) 
[55. 5, 56.5) 
[56.5， 57.5) 
[57* 5，58_ 5) 
[58- 5， 59* 5) 
[59_ 5，60_ 5) 
[60- 5, 61.5) 
[61.5, 62- 5) 
[62. 5* 63.5) 
[63. 5, 64,5) 
[64* 5, 65. 5) 
[65.5， 66*5) 
[66. 5* 67-5) 
[67.5， 69.5) 
[69- 5， 71*5) 
[71.5, 
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124 
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193 

137 

131 

154 

156 

174 

186 

191 

206 

193 

185 

153 

176 

147 

144 

140 

109 

111 

93 
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0. 03285 
0.01892 
0, 03259 
0. 03811 
0, 05072 
0. 0360 
0* 0344 
0, 0405 
0* 0410 
0. 0457 
0_ 0489 
0* 0502 
0. 0541 
0- 0507 
0. 0486 
0. 0402 
0. 0463 
0. 0386 
0. 0378 
0, 0368 
0- 0286 
0. 0292 
0. 02444 
0. 03338 
0. 02129 
0- 03995 


0. 03005 
0.02150 
0, 02921 
0. 04431 
0* 05630 
0. 0334 
0. 0398 
0. 0400 
0. 0426 
0. 0457 
0. 0472 
0- 0484 
0. 0486 
0. 0482 
0, 0472 
0_ 0454 
0. 0430 
0. 0402 
0.0370 
0. 0331 
0* 0299 
0. 0282 
0, 02247 
0_03552 
0_ 02547 
0* 03754 
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我们通过下面例子来说明正态分布的计算. 

[例 3] 从南郊某地乘车前往北区火车站搭火车有两条路线 
可走,第一条路线穿过市区，路程较短，但交通拥挤，所需时间（单 
位为分)服从正态分布 A T (50,100), 第二条路线沿环城公路走，路 
程较长，但意外阻塞较少，所需时间服从正态分布 iV (60，16)，（ l ) 
假如有70分钟可用，问应走哪一条路线？ （2) 若只有65分钟可用, 
又应走哪一条路线？ 

[解]显然应走在允许的时间内有较大概率及时赶到火车站 
的路线，若以 r 记行车时间，则有关概率如下 :• 

(1) 有70分钟可用时走第一条路线及时赶到的概率为 

/ 70 — 

/ 3 {r<70}=<P - - =<^(2) = 0. 9772 

上/ 

走第二条路线及时赶到的概率为 

/ 70—fi0\ 

P { r <70}=^ =4>(2. 5) = 0. 9938 

\ 4 / 

因此在这种场合，应走第二条路线. 

(2) 只有65分钟可用时走第一条路线及时赶到的概率为 

、 P{r<65} = ^ — =<p(L 5) = 0.9332 

走第二条路线及时赶到的概率为 

P{r<65}=^ — , =^(1*25) = 0.8944 

4 ) 

因此这种场合应走第一条路线. 

[指数分布]分布密度函数为 




: T>0 

x < C 0 


(3. 1.41) 


分布函数为 


6 ， X> ° (3.1.42) 

lo ， x<0 


这里 A >0, 是常数，这分布称 为指数分布. 


參 
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指数分布有重要应用，常用它来作为各种“寿命”分布的近似， 
例如无线电元件的寿命，动物的寿命，电话问题中的通话时间，随 
机服务系统中的服务时间等都常假定服从指数分布. 

指数分布的重要性还表现在它具有类似于几何分布的“无记 
忆性”.设随机变量$服从指数分布 (3. L 42)，则对于任意的 .>0, 


z>0, 










因此 

P {$^ s + t \^> s }= P { e > t ) (3. 1.43) 

假如把 S 解释为寿命，则 (3 •: U 43) 表明，如果已知某人的年龄为 h 
则再活 f 年的概率与年龄5无关，所以有时又风趣地称指数分布 


是“永远年青”的. 

下列事实也是正确的 ：指数 分布是唯一具有性质 (3. L 43) 的 


连续型分布. 

我们来证明这个论断. 

设芒 是非负的，其分布函数为 FCr ) ，记 


则由 （3.1.43) 可以得到 

G (5+0= G (5) G 0) 

对一切5>0 a >0 成立.因为 GU ) 关于 x 单调，所以由引理 2 . 4 . 1 
知 

G(x)=a x ^ x^O 

由于 G ( x ) 是概率，故 0< a < l , 可以写成^二厂、其中 A 〉0. 因此 

FCx ) = l - GU ) = l ~- e Xx , 


从而证明了结论. 

应当指出，指数分布与泊松过程有密切关系，若以 $(£) 记参数 
为 kt 的泊松过程，以 n 记它第一个跳跃发生的时刻，则 

P { r l ^ t }=- P {$( t )=0} 




128 . 



因此 


P { r ^ t } 




e 




这说明^服从指数分布 ( 3 . L 42 ). 下面把这个结果推广到更为一 
般的场合. 

[埃尔兰分布]若是参数为 At 的泊松过程，以记它 
的第 r 个跳跃发生的时刻.事件发生表明第 r 个跳跃出现 
在时刻 f 之前，因此事件 W ( Or } 发生， gp {^ r < 0 } 匚 
反之，若事件 K ( 0 > r } 发生，即在时刻 《时彡 U ) 之值不小于 r ， 这 
时第 r 个跳跃已经出现过，因此事件{恥< 0 发生，即有 W ( 0 > r } 

综上所述可知 


{W r <t}=-{Ht)>r} 


( 3 . 1 . 44 ) 


以尸 Or ) 记;^的分布函数，则 


F(t)=P{W r <t}^P{HO>r} 




s 


k 


⑻〜 -A 

~~ F ] ^ 




1_ 2 




* = 0 


因此 


p(O^F(0 


f I 

2 


(々） WA ) 


h _1 


k 


« 


+2 

k ^ 0 


k(At) 




學 


Ae — 七 


k 




0 


V ( w — 1 

,4； (^ D ! 


Hk) r l X r 

(r—1)! 


e 


/ V ) 


r ] e — 々 


因对于任意的 r > 0 ， A >0 


mf 




0 


X r 


r(r) 




( 3 * 1 . 45 ) 


所以，对任意的正整数 r 及实数 A > 0 , 


pix) 


X r 


{r 一 1)! 


广 1 e-k 


x^O 


( 3 . 1 . 46 ) 


是一个密度函数，称为埃尔兰分布，它是丹麦科学家埃尔 
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( Erlang ) 在研究电话问题时引进的，这些研究开创了排队论这一 
学科. 

前面的推导说明，泊松过程中第 r 个跳跃发生的时刻服 
从埃尔兰分布. 

S 

当 r = l 时,埃尔兰分布化作指数分布.另外，若记 

(3.1.47) 

T r =W r —W r - i , r=2,3".- 

则 r r 表示泊松过程的第 r 个来到间隔，用它们可以给出来到时刻 
%的如下表达式 


V^ r =ri+r 2 + … +r r (3.1.48) 

可以证明， A ， r 2 ，…， r r 均服从参数为 A 的指数分布,且相互独立. 
这个性质与巴斯卡分布类似. 

埃尔兰分布也可略加推广，当 r >0 为任意实数时，由 
(3.1. 45) 可知能定义如下分布. 

[ r 分布]称密度函数为 

广 ^>0 

T ( r ) (3.1.49) 

s0, 

的分布为厂 分布 ，其中 A >0, r >0 为参数.简记作 G ( A ， r ) (图 22). 
这里， A 称为尺度参数， r 称为形状参数. 

当然， r 分布包含埃尔兰分布作为特例，此外，它在概率论和 
数理统计中还有许多应用，是重要分布之一， 

[伯努利过程与泊松过程]若每隔士进行一次试验，则伯努 
利试验也可以看作一个随时间而变化的过程. 

在伯努利试验中,到时刻为止，共进行《次试验，这时成 
功次数服从二项分布.而在泊松过程中，到时刻《的来到数则服从 
泊松分布. 

为等待第一次成功,伯努利试验中的等待时间服从几何分布; 
而泊松过程中则服从指数分布. 


奪 
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为等待第 r 次成功，伯努利试验中的等待时间服从巴斯卡分 
布;而泊松过程中则服从埃尔兰分布. 

正如二项分布的泊松逼近，上述结果可以严格化.不过在这里 
列出这个对比，只是想让读者有一种系统地记忆几种常见离散型 
分布和连续型分布的方法. 

fix) 

1,0 

0, 75 

0, 50 

0.25 

"Of 1 2 3 4 5 6 7 8 ^ 

图22尸分布密度函数 

•五、 关于分布函数的一些结论 

我们已经证明了分布函数是单调函数，利用实变数函数论中 
关于单调函数的一般结果 ®, 不难推出分布函数具有如下 性质： 

(1) 分布函数至多只有可列个不连续点； 

(2) 对分布函数 F ( x ) 有勒贝格分解 

F ( jo )^= c i Fi ( x )-^- c 2 F 2( j ：)~^ C 3 F 3 ( jc ) (3.1.50) 

其中 ACr ) 是跳跃函数， /^ Cr ) 是绝对连续函数， F 3 ( x ) 是所谓奇异 
函数，它们都是分布函数;而 ，/ =1，2,3，且 G + Cz + Osl . 

在我们讨论过的分布函数中，离散型分布函数是跳跃函数，相 
当于在 (3. 1. 50) 中取 c 1 = l , c 2 - c 3 = 0 的场合;而连续型分布函数 

①参看复旦大学数学系.实变数函数论与泛函分析概要（第二版).上海科技出 
版社.1963,第四章 
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是 绝对连续函数，相 当于在 （ 3* L 50) 中取 c 2 : = l 9 C 1 = c 3 = 0 的场 

I 

合；自然会想到，也可以取 g = i 得到另一类分布函数. 
这个结论是正确的，理论上确实存在着另一类分布函数奇异 
型分布函数，它是连续函数，但却不能表为不定积分，因此它没有 
密度函数.不过到目前为止，常用的分布都是离散型或连续型的, 
因此我们不准备对奇异型分布多加讨论.以后证明结果或是对离 
散型进行，或是对连续型进行，或者对一般分布进行. 

§2. 随机向置，随机变置的独立性 

一、 随机向置及其分布 

在有些随机现象中,每次试验的结果不能只用一个数来描述, 
而要同时用几个数来描述，例如对于钢的成份，需要同时指出它 
的含碳量、含硫量、含磷量等等.这样，对应于每个样本 点〜试 
验的结果将是一个向量(匕 （01) ，匕 ( ttJ ) ，…，乞 ( o 0) ，这个向量取值 

于 n 维欧几里得空间 / e ". 

定义 3*2. 1若随机变量&0)»^0)，一，匕(0>)定义在同一 
概 率空间上，则称 

f(<w) = (^, {( o ) ，匕（&»)，…， f”0)) (3. 2-1) 

构成一个 《维随机向量 ，亦称 《维随机变量. 显然,一维随机向量 
即为随机变量. 

固然可以对随机向量的一个个分量分别研究，但是我们马上 
就会看到，把它们作为一个向量，则不但能研究各个分量的性质， 
而且还可以考察它们之间的联系，对许多问题来说,这是十分必要 

的. 

对于任意的《个实数^ r 2 , …， ： c „， 

{^i ( wXjtj ，汔 2 (00<1 2 ,… ，匕 0)< Cr „} 

— 0 (3-2.2) 
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亦即对于中的 n 维矩形 c '= ri (— °°，^：,)，有 

* = 1 

利用测度论的方法还可证明，若氏为 v 上任一博雷尔点集， 

也有 

{6(<w) B„} ^ (3.2.3) 

以后我们将要用到这个结论(图 23). 

类似于一维的场合，我们引进如下定义. 

定义 3. 2. 2称《元函数 

Fix x ,X 2 » ••• jX»)=P($i (w)<JCi , $2 (a>) <Cx 2 »w) < } 


(3.2.4) 

为随机向量 fO ) = ( KaO ，$ 2 ( w )， … ，匕 ( w )) 的(联合)分布函数. 

给定了联合分布函数后，可以计算事件彳七<<? 1 <6 1 ,^<^< 
b z ， … 的概率，例如当 w = 2 时， 

—F(bi <,b z ) — F(ai 也 ) — FQ?i ,a 2 )~\~F(ai »a 2 ) (3. 2-5) 

这个结果容易从图 24 看出. 



图23二维随机向量 图24 二维概 率计算 

类似于一元的场合，可以证明多元分布函数的一些性质. 
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( i ) 单调性 :关于 每个变元是单调不减函数； 

( ii ) F (: Tj ，: r 2 ，…，一⑺，…，: r ”） = 0， 

只（+ 00，+00,…， +00)=1; 

( iii ) 关于每个变元左连续. 

在二元场合，还应该有： 

( iv ) 对任意都有 

Fib x M - Fia , , b z )- Fib , ， a 2 ) + 尸 (岣 ， a 2 )>0 

为保证 (3. 2. 5) 式中的概率的非负性，性质 ( iv ) 是必须的，而 
且由性质 ( iv ) 可以推出单调性，但存在着反例说明，由单调性并不 
能保证性质 ( iv ) 的成立（见习题 12). 这是多元场合与一元场合的 
不同之处. 

可以证明 ：满足 ( ii )，( iii )，（ iv ) 这三条性质的二元函数是某二 
维随机变量的分布函数. 

类似的结论对/ I 元场合也成立. 

随机向量也有不同类型，最常见的也是离散型与连续型两类. 
在离散型场合，概率分布集中在有限或可列个点上.重要的多 
元离散型分布有多项分布与多元超几何分布，它们分别是二项分 
布与超几何分布往多元场合的推广. 

[多项分布]在试验中，若每次试验的可能结果为 

^42 广 . ，九，而尸 (A) = />,，* = 1 ， 2, … ， r ， 且九 + 外十 … +/v = l ，重 

复这种试验 n 次，并假定这些试验是相互独立的，若以 … ，乞 
分别记 ，… ，儿出现的次数，则 

P {f 1 = h ， ^ = 是 2 ，…， tt /> 2 * 2 … 户 A 

(3.2.6) 

这里整数々,>0,且仅当< + 1 +…时上式才成立，否则为 
0. 多项分布在第二章§ 3中已出现过. 

[多元超几何分布]袋中装号球 M 只，/ = 1，2，…， r ， 
%+坱+ "*+队=^，从中随机摸出 n 只，若以分别 
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记 1,2,…, r 号球的出现数，则 


尸{芒1=”1，彡2 = «2,… 


^r = n r } = 



N 


(3.2. 7) 

这里整数且仅当7^+712+…+〜=”时上式才成立，否则为 
0. 古典概型一节的例2就是这种类型. 

以上两个分布在抽样中常用，前者用于有放回场合，后者则用 
于不放回场合. 

在连续型场合，存在着非负函数/>(々，々， …， 心)，使 


1 n 

F(«r” … ， j ：„)= … piy\f* mm (3.2.8) 



这里的/>(^，…，〜)称为密 度函数 ，满足如下两个条件 


/?( 々， … ， : c„)>0 (3. 2- 9) 

陬 oo Poo 

… /Kx! ，…1 (3* 2. 10) 

J — OQ J — CXD 

随机向量的概念在各个基础学科和工程技术中已有广泛应 
用.例如在量子力学中，粒子在某个区域 G 的出现是通过概率来 
描述的.若以4表示它的波函数，则 Ml 2 即为密度函敉，而 


|^| z dxdydz 

J J ^ 

G 

就给出该粒子在区域 g 出现的概率. 

均匀分布和《元正态分布是比较常见的两种多维连续型分 


VrT 
n\l m 

[均匀分布]若 G 为 R " 中有限区域，其测度*5>0;则由密度 

函数 

1 

pixi fX n )=< ^ (3.2.11) 

0 f (^!，*** t x rt )6 G 


• 135 • 



给出的分布称为 G 上的均匀分布. 

在第一章几何概率一节中，我们已看到均匀分布的各种 例子. 
[多元正态分布]若心）是《阶正定对靡.矩 I 以 
B _1 = (〜) 表示忍的逆阵; detfi 表示 B 的行列式的值 • <!=(〜 ，…, 
心)是任意实值行向量，则由密度函数 


/?(々，，•• fX n ) 


(2 冗）了 (detB) 


exp 



定义的分布称为 n 元正态分布， 简记为 N ( a ， B ). 
这个密度函数也可以改为如下向量 形式： 


p(x) 


(2 宂）皆 （ det 忍） 


^exp —~( x — a ) B" ] (x 


(3^ 2.12) 



(3.2. 13) 

这里 Or — W 表示向量 U — fi ) 的转置. 

n 元正态分布是最重要的一种多维分布，它在概率论、数理统 
计、随机过程论中都占有重要地位,具有许多重要性质.对于这些 
性质的叙述和证明，我们将在引进了更有力的工具后再进行.这里 
我们将对它的特殊场合——二元正态分布逐步直接导出这些性 

质. 


二、边际分布 


为方便起见，讨论将对二维场合进行，多维时这些结论仍然 


成立 • 


先讨论离散型分布的场合，在这种场合，有关概念特别容易 


理解. 


考虑二维随机向量（夂7)，设 f 取值％, A ，…； ？取值％， 


^2 


，…记 


P{^=x l jy] = y j ) =p(x,,y；) n / ，） =] ， 2 , 


钃《 ♦ 


(3. 2- 14) 
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P{^=Xi } = p\ » / = 1 ， 2 ， … （ 3. 2. 15 ) 

p{r j ^y j } = p l (y j ), J=l ， 2, … （ 3. 2. 16) 

显然 

— ! (3* 2* 17) 

“j 

此外，对固定的 ^ ， 

^Jpixi yy ' j)=P {^= Xi } = px ( Xi ) C 3. 2. 18) 

J 

而对固定的_；’， 

, y ,) P { y—yj ] ~ p 2 ( y ,) (3. 2. 19) 


换句话说，由联合概率分布，对于固定的〗关于 j 求和得到$的概 

率分布;而对于固定的_；关于/求和得到7的概率分布. 

这里/ > i ( r ,) 与户 2 ()>)称为/ >(1 ，％)的边 际分布 .这个名称的 

含义通过下列两例将看得很清楚. 

[例 1] 袋中装有2只白球及3只黑球.现进行有放回的摸 

球，定义下列随机 变量： 

|1，第 1 次摸出白球 |1， 第 2 次摸出白球 

U ， 第1次摸出黑球 7: 1 o , 第2次摸出黑球 
则(匕 7) 的联合概率分 布与边 际分布由下表给出： 



0 

1 

1 

i 

1 

1 

广 2 (%) 

0 

1 

— . 1 _ - - 

3 _ 3 

5 ' 5 

2 3 

5 5 

1 丨 

i 

3 

5 

1 

1 

J 

i 

1 

3 2 

5*5 ! 

2 2 

- • —— 

5 5 

1 

2 

5 

1 

/ >l(X ) 

! 

! 

1 

3 

5 1 

2 

5 



[例 2] 前例中若采用不放回摸球，则(6,7)的联合概率分布 
及边际分布由下表给出： 
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X. 

■ 

1 

Pz<y^ 

0 


2 3 

5*4 

■ 

1 


2 _ 1 


丄 

1 

1 


5 * 4 


( 工 /) 


2 

5 



在上面两个表中，中间部分是（$，7)的联合概率分布,而边沿 
部分是 S 及7的概率分布，它们由联合分布经同一行或同一列的 
相加而得出来，这种表称为列联表.在列联表中， f 与7的概率分 


布处于表的边沿部位，因此称为边际分布. 

让我们再注意一个重要事实，两例中$及7的（边际）分布是 
相同的，但是它们的联合分布却完全不同.这里可以看出联合分 
布不能由边际分布唯一确定，也就是说二维随机向量的性质并不 
能由它两个分量的个别性质来确定，这时还必须考虑它们之间的 
联系，这也说明了研究多维随机向量的作用. 

般地，若（ I ?)是二维随机向量，其分布函数为， 
我们能由 FCr , 3O 得出$或7的分布 函数. 事实上， 

FjCj ：) = F{c <C x} = P{f<x ， 7<C + °°} = F(x ， + oo) 

(3. 2.20) 


同理 

— P{V 〈 y )= 尸 （+ °°，： y ) 

^( x ) R F 2 ( y ) 称为的边际分布函数. 

若 FCr ,>0 是连续型分布函数，有密度函数 p ( x f y ) f 那么 


F x (x) 



p(u^y)dudy 


因此 ACr ) 是连续型分布函数，其密度函数为 
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显然这是〃元正态分布当〃 = 2 时的特殊情况，相应的 





ra } a 


2 


W 2 


9 A 


^1 = ^2 


我们来求其边际分布密度函数，令 


a 


由 （3. 2_21)知 






p{x,y)dy 


A 


2na, /l 


exp 


2(1 - r 2 ) 


wJ 




u 


2ruv + v ：i ~] )d77 


e 


n 


v 2^ a { 




• exp 


2 

r u 


2ruv + v 




2 


) 


2 


2(1 — ) 




e 


it 


v 2 na x 




e * b_r«) 2 /[2(l —r 2 )]dp 


.2 


) 




e 


/2 


(x — 


/ 27 ra 


C 2&. 


(3. 2. 23) 


即 AU ) 是的密度函数，同理 


Pz ( y ) 


v2^(t 


( y - a 2 ) 

e io\ 


(3, 2. 24) 


因此二元正态分布的边际分布仍为正态分布，这是一个重要的结 
论. 

由 （3. 2. 22) 定义的 p ( x f y ) 显然非负，又由于 


ex) 


p(x 9 y)dj：dy 


― t. 




( x ~ 


e 




^ r 2 na 1 


2ff 


2 


d ^: 


因此我们已顺带验证了 pU ^ y ) 确实是一个密度函数. 
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对于〃维场合可以类似讨论其边际分布，值得提醒的是，对 ， 
维分布而言存在着” 一 1 维，〃一 2 维，…… 2 维， 1 维的边际分布 • 


〆 


三、条件分布 


对于多个随机事件可以讨论它们的条件概率，同样地，对于 
多个随机变量也可以讨论它们的条件分布，并由此得出重要结果. 
仍对二维的场合进行 讨论. 也还是先从离散型开始，这时并 


无多大困难. 


若已知彡 = x t ( p x { x ^ > 0 ) ， 贝 |J 事件 {7 


P\V = y 




P {^ 


工 , 


P {^ 




=的条件概率为 

yj) = P ( 工 t ， y) 

夕1(不） 

(3. 2. 25) 


这式子定义了随机变量7关于随机变量$的条 件分布 • 在一 
般情况下，它不同于 /> 2 (%)，这表示从 f 的取值可以得出关于7 
的某些信息，反之亦然. 

对于一般随机向量（彡， 7), 我们也想定义条件分布函数 
P { 7 < jR = 但是由于会出现 = 4 = 0 ,因此我们不能 
像(3.2_25)那样简单地定义. 

自然会想到可以用 

P {^ < y \^ = lim P {rj <i y\x ^ ^ <Z jc + Ax } 

Aj— 0 

_ r P{x ^ ^ < x + Ax,7 < y } 

= ~ 尸 U <1 + Ax }~~ 

_ y F(x + Az，>Q — F(x,y) 

= 戸 (x + Ax ， ⑺） 一 FCr ，— ⑴) 

(3* 2. 26) 


来定义. 

特别是对于有连续密度函数的场合，这定义导出 


P {7 < ^ 1^ — ^ } 


lim 



'x+Ar 

J t ^ 

m y 

p(u 9 v)dudv 

— OO 

'JC + Ax 

J X « 

,00 

p(u^v)dudv 

— OO 


* 141 • 




若把上式的分子分母分别除以仏，再令 Ax — 0取极限，则当 


Pi (< r ) # 0时， 


I 

: y 


P{V < y \^ = ^) 




p(jo f v)dv 
户] o ) 


p{x f v) 

Pxix) 


dv 


因此在给定 6 


=X 


的条件下，7的分布密度函数为 


户 （jy |x) 


p (^ fy ) 

p\(x) 


(3.2*27) 


同理可得在给定 7 = ^ 的条件下/的分布密度函数为 


p (^ o \ y ) 

这里当然也要求/> 2 (30关0 . 


pix.y) 

Pi(y) 


(3. 2. 28) 


[例 3] 对由 （3. 2. 22) 定义的二元正态分布求条件密度函数 


P (： v | x ) ，由 (3.2. 27) 


p ( y \^ c ) 


p(x y y) 

Pi(jc) 




2^ y 1 ~~ y^ 2 


exp 


_ 


(^c — a x Y 2r{x — a x )(y — a 2 ) 


2 (1 - r 2 ) 


(y — a 2 ) 


^2 



(■X — aj) 

2 a \ 


a 2 


exp 


2Q - r 2 ) 


(x — a x ) 



2r(x — ai)(y — a 2 ) 

a \ a 2 



(y — a 2 ) 


a 2 


• exp 


x 


2 ( 1 - 7 ) 


A 


A 


/2 n ( r , 


1 - 


exp 


2<y\{\ — r 2 ) 


' < j 2 

• y ~ ci 2 r — (jc — a x ) 

L 


(3*2.29) 
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从这里我们看到，二元正态分布的条件分布仍然是正态分布 

N a 2 -j~ r —(x — a! )(1 — t 1 ) (3. 2* 30) 

特别指出，这里 m = A + r>Cr — 〜）是工的线性函数，这 
个结论在一些统计问题中很重要. 

四、随机变量的独立性 


在上章中，我们看到随机事件的独立性起着很大的作用.下 
面研究随机变量的独立性.引入如下定义 • 

定义 3. 2.3 设…，乞为《个随机变量，若对于任意的 

工1，… 成立 

m < X! <x„} = p {$ 1 < & }”.m < 

(3. 2.31) 


则称 I ，…汔是相互独立的. 

若乞的分布函数为 K0r)，f = 1，2,…，《，它们的联合分布函 
数为八々，…, xj ， 则 (3. 2. 31) 等价于对一切々，•••, A 成立 




(3. 2.32) 


在这种场合，由每个随机变量的（边际）分布函数可以唯一 
地确定联合分布函数.而且由 （3. 2. 26) 可以看到，这时条件分布 

化为无条件分布 


^ iv ^ y \^ = = Piv ^ y ) (3. 2. 33) 

即由 S 的取值不能得出任何关于7的信息. 

对于离散型随机变量， （3. 2. 31) 等价于对任何一组可能取的 
值，…， x „) 成立 

m = a ， … ，芒 ” = x„i — 尸 {I = } … 尸 { 乏 = xj 

(3. 2. 34) 


例1中有放回摸球时的 f 与7是相互独立的，这时联合分布 
取乘法表的形式；例2中的 f 与7不是独立的 • 这些例子也说明， 



如果两个随机变量有相同的分布，则它们可以是独立的，也可以 
不是独立的. 

对于连续型随机变量，条件 （3. 2. 31) 的等价形式是对々，•••， 
Xn 几乎处处成立 


户 （ jt” …， xj =/>〆 々） … 九 （:^) (3.2.35) 

这里户(: Ti ，…， A ) 是联合分布密度函数，而 ，i 二 1，2, …， 《 
是各随机变量的密度函数. 


[例 4] 对由 （3.2.22) 定义的二元正态分布，有 






exp 


O — a x ) 2 
2 o \ 


iy-at ) 1 

2< y \ 


与 （3.2.22) 比较可知，使关系式 (3_2_ 35) 成立的充要条件是 


r =0 (3.2.36) 

即服从二元正态分布的随机变量独立的充要条件是 r = 0,这时条 
件分布 (3. 2. 29) 化为 


piy \ x ) = e ~^ — = p 2 ( y ) 

v2n<x 2 

这与 （3. 2. 33) 是一致的. 

上面我们列举了随机变量独立性的各种表达形式，有些是对 
一般随机变量成立的，有些只对离散型或连续型才成立，一般说 
来，这些条件比较易于验证.下面我们介绍另外一个条件，这条 
件不易验证，但在理论研究中有用. 

随机变量$，€，•••，&相互独立的充要条件是对一切一维博 
雷尔点集 A X , A 2 ^*» , A „ 成立 

P {^1 ^ ^1^2 ^ -^2 »*** G A n } 

- P{^ e a}p {^ 2 e a 2 }-p{$„ e (3.2.37) 


论断的证明要用到测度论，已超出本课程范围. 

当然也可以建立〃维随机向量 f 与 m 维随机向量 rj 相互独立 
的概念，这时要求成立 

P{(e e B] = p{^e .4}Ffi7 e b} 
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其中 A , B 分别是任意一个〃维及 m 维的博雷尔点集. 


显然若$ 与 7独立，则^的子向量与7的子向量是独立的 • 
此外，注意到若…，乞相互独立，则其中的任意以2< 
r < n ) 个随机变量也相互独立.例如，我们证明 I 相 
互独立. 

F {^ < Xj < x n - x } 

=< 工”… ，气一 1 < 了《-1，芒《 < °°} 

= m < X ] < x n -x } p {^„ < < xj } 

最后，称无穷多个随机变量是相互独立的，如果其中任意有 
限多个随机变量都是相互独立的. 

随机变量的独立性概念是概率论中最基本的概念之一，也是 
最重要的概念之一，关于独立随机变量的研究构成了概率论的重 
要课题，我们将在第五章中介绍一些基本结果. 

有了独立性的概念，可以介绍一个导出正态分布的条件.先 
证明一个分析引理. 

弓 I 理 3. 2. 1若/(工）及容 ( y ) Or >0， yXl ) 是不恒等于0的 

连续函数，而且对一切非负实数 x 及^成立 

= h{x + y ) (3.2.38) 

则 

f ( X 、= ka% 工 > 0 (3.2.39) 

这里々及 a 是常数 ， a >0. 

[证明]首先证明/(0)关 0. 用反证法，假定/(0) = 0,则 

I . 

-I. 

hiy ) = 0,由于 g { y ) 不恒为0,有一个％ 使 〆 y 。） 关 0. 因此 

/ U ) - H _ J °) =0,这与 fix ) 不恒为0的条件矛盾，因此 

/(0)弇0.同理可证 g (0) 关 0. 

其次在 （3. 2* 38) 中令 x = = 0,得/0)发(0)=打(之），又 

_______—^ 

在 (3* 2. 38) 中令 a = 0 ，：y = 5：得 f (0) g ( z ) = h ( z ) , 因此 
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fiz ) g { 0 ) — fiO ) g ( z ) = h { z ) 

两边除以 f ( 0 ) g ( 0 ) 并记得到的比值为 Piz ) ，则得 

— ― h ( z ) _ 

/(O) _ 貧 (0) — f(O)giO) ~~ pKz) 

代入 （3. 2. 38) 得 

p{oc)p{y) — pix 4- y) 

利用引理 2. 4.1 知 

p { x ) = a 1 

因此 

fix ) — f (0) a x 

引理得证. 

[射击弹落点分布]在火器射击问题中，假如过射击目标中 
心作直角坐标系的 I 轴及^轴，每次射击弹落点由于受随机因素 
影响会偏离目标，它的坐标 (17) 是一个二维随机变量.假定满足 
下列 条件： 

(1) f 与7具有连续的密度函数，分别记为九 U ) 及九00 ; 

(2) S 与7相互独立； 

(3) (夂 7) 的密度函数在 OcoO 点的值仅与它到原点的距离 

r = / x 2 +~ y 2 有关. 

则芒与7均服从正态分布. 

[证明]记（芒，7)的密度函数为由假定 （3) 知 
p ( x y y ) = q ( vV + y 2 ) ， 再由假定（1>， （2) 知 

Pi ( x ) p 2 ( y ') = qi 7 j : 2 -f >?) 

因为九 U) 及九 (: v) 是密度函数，当然不能恒等于0,故可利用引 

理 3. 2. 1[把声1(工）看作/0 2 )，/> 2 (夕）看作尺 (_/) ，<?( /x 2 + y> 看 

作 ACr 2 +y)], 得到 

2 

= ka 1 

由于户， r) 是 (一 oo,oo) 上的密度函数，因此必须有 0< a < 1 ， 记 
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— 1 /( 2〆 


> ，其中 A > 0,利用 


p x ( x)dx 


1，可知 


k = ~~ F ^、 这样一来， 

V2no, 


PiU) = - e "^ 

v2n(Ti 

因此 $ 服从正态 分布. 同理可证 7 也服从正态分布. 

§ 3. 随机变置的函数及其分布 


一、 博雷尔函数与随机变量的函撖 

在许多问题中需要计算随机变量的函数的分布律，例如在无 
线电接收中，某时刻收到的信号是一个随机变量夂若我们把这个 
信号通过平方捡波器，则输出的信号为？=浐，这时我们需要求 V 
的分布律.又如在统计物理中，已知分子运动速度 f 的分布，要求 

其动能7 = 的分布律.这类问题既普遍而又重要，接下来我 

们就要讨论它. 

这类问题较为一般的提法是:若$是随机变量，求7 的 

分布律. 

为了使7有分布律可言，当然要求V是随机变量，因此对函数 
3；二 gU ) 也必须有一定的要求，为此我们提出如下定义. 

定义 3.3.1 设: y = gix ) 是 R 1 到 R 1 上的一个映照，若对于 

一切 R 1 中的博雷尔点集及均有 

{jc : g ( x ) G iM € 激1 (3. 3.1) 

其中溪^为 R 1 上博雷尔 a 域，则称 Wx) 是 一元博雷尔(可测)函 

數. 

博雷尔函数是很广泛的一类函数，我们所碰到的大部分函数 
都是博雷尔函数，特别地，已知所有的连续函数及单调函数都是博 
雷尔函数. 
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若 $ 是概率空间(仏， ， p ) 上的随机变量 ，而发 (^)是一元博 
雷尔函数，则^ '( o 是⑴,，，/^上的随机变量.事实上，对 一切私 
6滅有 

{<o : g(^(o>>) € /m = e e ^ 

(3. 3. 2) 

这里^、私） 二 {-r : gU ) 6杜}，由 （3. 3.1) 知它是一维博雷尔 
点集，再根据随机变量定义中的 (3. 1. 1 ) 式即得 (3. 3. 2). 

有时，我们还要考虑随机向量的函数，例如7=6+4就是随 
机向量 ( H ) 的函数.一般地，要研究7 =发 ($ ， …， O 及其分布. 
这时对《元函数} = gU x r -, x n ) 也要有相应的要求. 

定义 3. 3. 2 设 : y = …， x „) 是 R ” 到 R 1 上的一个映照， 

若对一切 R 1 中的博雷尔点集私均有 

{( A ，… ， jc „) •• ， x „、G (3. 3. 3) 

其中激 „ 为 R ” 上博雷尔 a 域，则称 gix . r - , A ) 为 n 元博雷尔(可 

测）函数. 

同样地，若（6,…，匕）是⑴, V )上的随机向量，而 
〆 々，…，工„)是 n 元博雷尔函数，则貧 ( f ， … ，乞）是 U 3， y ， P ) 上的 

随机变量. 

这个事实证明 如下： 

{cu ••《( lO ) ，…，氕 O )) € 取 } 

= {w : (&>) ，…， K < w )) 6 6 ^ (3. 3. 4) 

其中 f 1 (瓦）是 （3. 3.3) 中点集， 它是” 维博雷尔点集，而按 
(3. 2.3) 即得最后的关系式. 

更一般地，还要研究《维随机向量($，…， 6) 的 m 个函数 
君 id ， …， 0,…，^(匕，…， D ， 这里 A ， …，^都是《元博雷尔函 
数，这是一个 m 维随机向量，需要求出它们的分布. 

一般地来说，对于离散型随机变量，求它的函数的分布并不很 
困难. 例 如:若 $的分布列为 
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X 2 … x n … 

、 P\ Pi … pn 

则 _ 的分布列可由下法得到，列出 

< pix 2 ) … <pi 工 n ) … 

, Pi Pt … Pn 

当然这里可能有某些 < pM 相等，把它们作适当并项即可. 

[离散褶积公式] 若专与 v 是相互独立的随机变量，它们都取 
非负整数值，其概率分布分别为及{乂}，下面我们来计算随机 
变量？=$+7的概率分布.因为 

1C ~ r} -= {6=0,7 = r} + {«? = l，7 = r— 1 丨 + … 

+ {芒= r ，7 = 0} 

利用独立性的假定得到 

c r ^ P {^ — r \ = a Q b r -f- a x b,-. x + **• + a\，r = 0 ， 1 ， 2,… 

( 3 . 3 . 5 ) 

这就是求独立随机变量和的分布的公式 -一 离散褶积公式 ，亦称 

离散卷积公式， 

下面的讨论主要对连续型随机变量进行.我们将由简到'繁逐 
步深入. 

二、单个随机变置的函数的分布律 

先从两个简单的例子开始. 

[例 1] 若随机变量$有密度函数/ > Cr)， 而7 = W + h 这里 
a # 0.求7的密度函数 g ( y ). 

[解]分别记 每与 V 的分布函数为 FCr) 及 GCy) ，显然有 

0(y) — P{r) < 3 /} = P{a$ + 6 < jy} 

j 外 1 叫 ^)，若“〉。 

, ( 3 . 3 . 6 ) 

P h > y -^1\ = l _ F ly ^ zA \ ，若 “< 0 

1 I ^ / ^ 
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因此 


f 




a 


P 


y 




b\ 


a 


若 a 〉 0 


(3.3. 7) 




a 


p 


y 


a 


若 a 〈 G 


或统一起来，写成 


g(y) 


a 


P 


y — b 


a 


(3.3. 8) 


把例 1 的结果应用到正态分布的场合.若 S 服从 iVU ， CT 2 )， 
则7=¥的密度函数 





{ a ' 

■ 

2 " 

g(y) = C • _ exp 」 

>/ 2 丌 J 


a 

i ° ^ 

—— a 

i 



2a z 


j 


丄 C - v 2 / 2 

y /2 n 


即7服从#(0，1)，这是我们早已提到 过的. 

[例 2] 若$为连续型随机变量，其分布密度为/ >( x )， 求7 = 
sin 奁的分布 • 


[解]记 GCy ) =尸{8!1^<3；}* 当 y <— 1 时， GCy > =0,当 
: y>l 时， Gb ) = 1.当一1 <夕< 1 时（图26)， 

G(y) = F{sinf <C y] 


= 2 P{ 2 kT ： — O + sin 一】 y) < $ < 2 々兀 + sin—4} 

k= - ^ 


f% 



p(x)dx 


(3. 3 - 9) 



图 26 7 — sinf 的分布 

一般地，若 $ 为连续型随机变量,其密度函数为 /> Cr )， 而7 = 
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/(0 ，我们对下面两种情形进行讨论 

(1) 若 fix ) 严格单调，其反函数/二 1 lx ) 有连续星亂数 ，则 


/(勹是真有密度函数 


① 




(3.3* 10) 


的连续型随机变量. 


[证明]对于任一实数 a ,记使 fixXa 成立的: r 的值的范 


围为£0)，贝 IJ 


P\V <<^} 




P { f ^)< a ) = P {^ 6 E ( a )} 






E(a) 


p { x)dx 




/^广切]丨[广 1 (>0]，1办 


这里用了积分的变数代换.由上式知道7为连续型随机变量，其密 
度函数为 (3. 3.10). 

显然可利用这个结果直接计算例1中的密度函数.下面是另 


一个例子， 

[例 3] 若 0 服从 I 3 的均匀分布， 0 = 试求必的 

密度函数 〆 : V ). 

^ 1 _ 

[解]记 J = tgi ， 则 x = tg _1 y ^ ^ t 因此由 

(3.3. 10) 知 


g(y) — — # ； ~^~一 oo < 〈 oo (3* 3. 11) 

7 T 1 + 〆 

由 （3. 3. 11) 定义的分布称为柯西分布，它是概率论中有名的分布 
之 一. 

(2) 若 / Cr ) 在不相重叠的区间 A ，/ 2 ，…上逐段严格单调，其 
反函数分别为…而且\(3；)，心00,…均为连续函 
数，那么7 = /( 勺是连续型随机变量，其密度函数为 

/I + 户 [九 2(： y )] IM (: V ) I + … （3. 3. 12) 

[证明]给定实数 a ,以瓦 U ) 记 A 中使 / Or ) < a 成立的 x 


①这里和下面都约定，对使反函数无意义的: V ，密度函数定义为 0. 
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的集合，显然诸艮 U) 不相交，而 


P { r )< a ) - P { f ^) < a \ 




2 


E (u ) 
: 


p(x)dx 


二 ^ pL^iiy)!\K (y) jd^y 

- *• L ，f l 

I 。 … 

= (y) \dy 

_ ■ OC ' ^ 

i 

因此 7 是具有密度函数 (3. 3.12) 的连续型随机变量 • 


这结果包含了单调的场合 (3. 3. 10) ，此外，例2也是其特殊场 
合.再看下面例子. 

[例 4] 若 f 服从#(0，1)，计算7 =户的密度函数 • 

[解] J = fix ) = x 2 , 分段单调，在（一 00,0) 中反函数为 


X = h x { y ) = — t 而在 [0,oo) 中反函数为 x = A 2 (30 = ， 


因此根据 (3. 3.12) 知道？的密度函数为 


g ( y ) = < pi — V y ) 





< p ( ) 


2 ^fy 




y 


2 


，: V > 


(3.3.13) 


顺便指出， （3. 3* 13) 是下列分布当 
[X 2 分布]具有密度函数 


1时的特例. 




n/2 


r 


n % x 

X2 L e 2 , 


>0 


(3. 3. 14) 


的分布称为具有自由度 《 的 X 2 分布. 

尤 2 分布在数理统计中有重要应用.与 (3.1.49) 中的 r 分布比 

较，我们可以知道^分布是它的特例，其中取 A = = 即为 

g ( |,y ). 以后简记 f 服从自由度 ”的; f 2 分布为$ 

这里，我们要再提到一个有趣而重要的事实. 
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[均 匀分布的特殊地位]若随机变量6的分布函数为 FU )， 

因为 FU ) 是非降函数，对任意0 < 1，可定义 

F 1 (^) = inf{x : F(jo) > jy } (3. 3. 15) 

作为尸 U ) 的反函数. 

下面考察随机变量沒(勺的分布，这里 FU ) 是连续 函数. 

X't 0 ^ x < 1, 

P{B<x) = P{F(e) <jc} 

=P{^ <C F~ l (x)} = F{F~ 1 (x)) = x (3. 3.16) 

即 6 = FG ) 服从 [0，1] 均匀分布.这个结论在统计中起重要作 
用. 

反之，若0服从[0，1]均匀分布，对任意分布函数 FCr )， 令 

^ ^ F~ l i9) (3.3.17) 

则 

P{$< x } - P{F~m <3c) = P{d<F{x)} = Fix) 

因此 S 是服从分布函数 Fix) 的随机变量. 

这样，只票我们能产生[0，1]中均匀分布的随机变量的子样 
(观察值），那么我们也就能通过 (3. 3. 17) 产生分布函数为 Fix) 
的随机变量的子样，这结论在蒙特卡洛方法中具有基本的重要 
性.通常的做法是利用数学或物理的方法产生[0，1]中均匀分布 
随机变量的子样(称为均匀分布随机数），再利用变换 (3. 3. 17) 得 
到任意分布 FCr ) 的随机数. 

^随 机变量 的存在性定理 利用上述结果，我们可以给下面 
定理一个构造性的证明. 

定理 3. 3. 1 若 FCr ) 是左连续的单调不减函数，且 F ( — oo ) 
= 0， F (十 m ) = 1，则存在一个概率空间 ( D ，^， 尸）及其上的随机 
变量 fO )， 使 SO ) 的分布函数正好是 F ( x ). 

[证明]取 D =[0，1]， 再取^为 [0,1] 中博雷尔点集全体， 
而 P 取为直线上的勒贝格测度（它是长度概念的推广，但对一切博 
雷尔点集都有定义).定义^ >) =%则^>)是02，^)上的随 
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机变量，又对一切0 < 工< 1， 

■ 

P {^( oj ) <C oc } = P {(o G [0， t )} = x 

因此 O ( co ) 服从 [0，1] 上均匀分布. 

再利用 （3. 3. 15) 定义00,当然它也是单调函数，从而是 
博雷尔函数，令 

^(o>) = F~ l (6(to )) 

则芒 (w 是 (fi，y) 上的随机变量，而且仿上段讨论可知，它的 
分布函数正好是 FCr). 


三、随机向置的函数的分布律 

若 V = /(I，… A)， 而 (6 ，•••,&)的密度函数为/>(々， 
J ,则同上面一样讨论可以得到 ' 


» » • 


G ( y ) = P{rj < ^y} 




■% 

p { x x ^ *** , j ： ft ) dx 1 "- d t 3： 


n 


V V 

/( V" ，: r 鼸 ><：v 


(3* 3* 18) 


我们看一些例子. 

[和的分布]若7 = 6+6,而（6，芒 2 )的密度函数为 pix , 


工2)，则 


/i 


F ( y ) = P { r ) < y ) 


pix x ^x 2 )dxidjc 




J 




Cy- 


- CXJ 


' p ( x x ^ x 2 ) dx x dx z 


(3. 3. 19) 




特别当 H 相互独立时，有 p ( x lf x 2 ) = p l { x l ) pz { x 2 )y 这里 
A(A) 为 6 的密度函数 ，九 u 2 ) 为 6 的密度函数 • 代入 (3. 3. 19) 
得 


F ( y ) = 


a / 


dxi 


p\ (a ： i)p2(x2)dx 


dj：i 


p\ (x])p 2 (z—a ： i)dz 


一 uO 


* 
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因此 7 的密度函数为 



户1(工1)户2(之 


x x )dx x dz 




= p x { u ) p z ix — u)du (3 - 3* 20) 

J — oO 

也 可写为 

•OO 

p { jc ) — pi(x — u ) p z ( u)du (3. 3.21) 

J — -X3 

(3.3. 20) 或 (3. 3. 21) 称为褶积公式(或卷积公式)，在概率论中相 
当重要. 

[商的分布]若 7= 而 ( H ) 的密度函数为 〆 4,4)， 

则 


G(x) = 尸 { 々〈 j:} = P 


^2 


<C x 




p ( x lf jc 2 ) dx l dx 2 


X. 


Ar 2 < 


X 


(T 


0 


zx 


p(y 9 z)dy 


cX ： 


dz 




r* Coo 

M p ( yfz)dy 




dz 


7 的密度函数为 


# (工） 




OO 


p(zx^z)zdz — 


_0 


p(zxfz)zdz 


\z\ p(zxfz)dz 


(3. 3 - 22) 


(3. 3,23) 

■ 


* [关于顺序统计量的若干分布]若^,6，“•，乞是相互独立 
的随机变量，具有相同的分布函数 FCr )， 而 G 及 f 相当于把 
6，…，夂按大小顺序重新排列为 


G … f (3. 3_24) 

的末项及首项，它们在非参数统计中有重要应用.下面讨论几种 
与它们有关的分布. 

首先求 G 的分布函数， 


P{^n < 了 } =P{max($ l 1 -## ^«)<^} 
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= P {^ i < x ，芒 2 <> ，…，乞 <了 } 

= - / M 6 2 < Cr } … PKCi } 

^LF(x)y ( 3 . 3 . 25 ) 

其次求 G 的分布函数，注意到 

P {^ = 尸 { min ($ ，… ，匕 } 

= 尸 { 冬 1 工， ^2 ， •• • ， ) 

=邮>工}叫 2 >工} …尸 {氕糾 

= [\- Fix^ n 


因此 


P {^ i 〈: c } = 1 — [1 — F ( x)^ n 

进一步，讨论(彡 r ) 的联合分布 • 

记 < Cx ， 芒： <： y }. 

若 : r > ： y ，则 

(;( 工， 30 = 尸旧 < 工，芒 ：</ 

= P{^ ： <y} = LF(iy)l n 

，则 

G ( x , y )^ P {^<^^：< y ) 


( 3 . 3 - 26 ) 


( 3 . 3 - 27 ) 



= p {^：< y }- P {^>^^：< y } 

=-lF(y)J-lF(y)-F(x)J 


( 3 - 3 * 28 ) 


其联合密度函数为 


gioo . y ) 


0, 


y 


n(n - DlF ( y ) - FU )] 71 — 2 / (工 ）/(， ） ，工 < J 


( 3 . 3 . 29 ) 


最后，我们来求极差 ^ = c f 的分布密度函数 /«( r ) ，显 

然对 r < 0 , f R ( r ) = 0，若/~>0，则 


P { R < r ) 


g ( r f y)dxdy 


y-^< r 




oo 


_J ■卜 r n 

g{xjy)dy dx 

- 一⑷ J 
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因此 


,oo 


^1 — 【■ J > 


Cr 

■ 

J — ^ GO 

■ _ 


貧 （： T，：T 十 Z)dz 


dx 


g{x f x^rz)dx 




dz 


Jr (-^) 


f%. 


gix ^x-\-r)dx 






nin — 1) 






[F(x+r)-FU>] 


— 2 


• fix) /(x+r)dj ： 


(3. 3. 30) 


四、随机向量的变换 


若 ( t ，…， o 的密度函数为/>(々，…，心），求％ = / id ， …， 
尽 ”），…， Vm = / md ， …， D 的分布.这时有 

G (:^，… ，: ，•••，〜<>} 


= … p ( x ” … jx n ) dx \ 9 mm dx n 

J J 

. , 1 ( 1 ]，-“ ， \)< 夕1 

»■ » 

f 

(3*3,31) 

显然，这是最一般的场合.当 m = 1时便是随机向量的函数 
的情形，当 W = n = 1时得到单个随机变量的函数的 情形. 下面考 
虑另一个重要的特殊情形，即当（ I ， … ，乞）与有 一一 
对应变换关系时，当然这时 n = m 必须成立. 

若对 y , = /,(々 ，…， xj 存在唯一的反函数，…，％) 二 
工 ,d = 1，…，《)，且 (1 ，…，7»)的密度函数为9(%，•_•，: y »)， 那么 






q{u } , ••• 9 u n )du 1 ** m du n 


J J 
«】<& 


(3. 3. 32) 


U n < y n 

比较 （3* 3, 31) 与 （3. 3. 32) 可知 

9(:^1， …，: yJ 
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^ X n ) \ J \ ，若(: Vl ， …， 30 属于 / l， …， /n 的值域 
1 o , 其他 

(3. 3. 33) 


其中 J 为坐标变换的雅可比行列式 



3x x 

▲ 里必 

dx n 

3yi 

3yi 


3Xn 

. • • • 

^y n 

dy n 


(3. 3. 34) 


这里，我们假定上述偏导数存在而且连续. 

公式 （3.3.33) 对应于单变量场合的公式（3.3.10)，也可以 
导出对应于公式 （3.3.12) 的多变量场合的公式，这留给读者作 


为练习 • 

[例 5] 若 （ U ) 的密度函数为 p (心， x z ) ，而 

Vl = 

tj 2 — c$i + d ^ 2 (3 - 3- 35) 


这里 △ 


c 


d 


关0,试求 ( n ) 的密度函数 Wjvi ，％). 


[解] 

在本例中 


- 


= (工1，工 2) 


yz 

= f % (工 1 ，工 2 ) 

因此 

d 

A = A ， 1 

b 

△ J2 ， 工 2 

而 








ax x -h bx t j 
cx x + dx t 


y\ 



yt 



d 

A 



b 

A 


A 


ad — be _ 1 

A 2 ad — be 


最后得到 
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p 


qiy \ ，: v ?) 


d 

l A 




c 


y % 


y \ 


a 


yz 


ad — be 


〔 3 . 3 , 36 ) 


[例 6] 若 l 7 为独立随机变量，且分别服从 G ( A ， n ) 及 G 


( A ， r 2 ) ，试求 a = e+rf 与择 




的密度函数 g ( u ， z ；). 


[解] 


对 w >0， 作变换 w = x + ： y ， 幻 


x 


oc + y 9 


因此: r = ⑽， y = u (\— v ) t 00<1. 


dx dx 
du dv 

3 y 9 y 

du dv 


V 


u 


1 —— V 


u 


u 


所以 


\ J \ 


u 


u ^ 0 


这样，0, /? 的联合密度函数为 


A r i 


q(u ， v) = zx ri ~ l e~~^ 


X r z 


r(rj 

A r i 


T ( r ? ) 


y r ^ l e ^ h \ J \ 


r(r 1 )r(r 2 ) 


(uvY^ ^uil — v)] r 2 _ 1 e~& • w 


A r i 


F(ri + r 2 ) 


W r 1 + V l e ^ 


r ( r 1 +广2) 

r(r 1 >r(r 2 ) 


V 




-1 


u ^0 f 0< iv<il 


因此， a 与卢独立，而且 a 服从 G ( A ， n + r 2 ), 这揭示了 r 
分布的一个重要 性质： 若两个相互独立的 r 分布随机变量 爸与 v ， 
具有相同的尺度参数 A ， 各具有形状参数 n 及 r 2 , 则其和$+7服 
从 G ( A， ri + n ). 这个性质称为 r 分布的再生性，简记作 


G ( X 9 r x ) * G ( A f r 2 )= G ( A , r ^- r 2 ), 

随机变量/?服从如下分布 
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T ( r x + r 2 ) r 

f(rOr(r 2 ) V 

0， 


- 1 


(i 


其他 


(3. 3. 37) 

这个分布称为 0 分布， r x R rz 为它的参数，这也是数理统计中的 
一 个重要分布. 


五、随机变量的函数的独立性 


首先证明一个定理. 

定理 若 …， 是相互独立的随机变量，则 
f ' ( G ， …，人 ( O 也是相互独立的，这里/, U = l ， …， n ) 是 
任意的一元博雷尔函数. 

[证明]对任意的一维博雷尔点集 A ，…， 戌有 

尸{/\(匕）63】 ，…， /„ (乞 ）6 A «} 

定理的结论在直观上是明显的,但在定理的证明中却要两次 
用到未证明的论断 (3. 2. 37) 其中第一次用来指明对$，…，夂的 
有关概率可以化为乘积的形式，另一次用来说明最后的等式表明 

/„( U 是相互独立的，且第一次是难以避免的. 

这个结果可以推广到随机向量的场合. 

例6说明，即使由相同的随机向量构成的不同函数也可能是 
独立的，这种情况在概率论与数理统计中相当重要，下面再讨论- • 
些例子. 

[例 7] 若$与7是相互独立的随机变量，均服从 iV (0, 1)， 

试证化为极坐标后，户二及产 arctg (|" j ，取值于[0, 

2 k ]， 是相互独立的. 
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[解] 


采用极坐标 ， x = rcosd , y ^ rsxnd , 因此 r = 



^=arctg — ,因为 d 7) 的密度函数为 


p(x,y ) = 






e 


- ( x Z + /)/2 



即 V ^+7 2 的密度函数为 

尺⑺ =j r 〆' r> ° (3. 3. 39) 

、0， r < 0 

这个分布称为瑞利 ( Rayleigh ) 分布. 

而 9= arctg | ■服从[0, 2 tc ] 中的均匀分布，并且它们是独立 

的. 

这个结果常被用来产生服从正态分布的随机数.做法如 下:产 
生相互独立的[0， 1] 均匀分布的随机数 Up " 2 ，令 

彡二 {— 2\nU cosZ^U 2 


^=( — 2 \nU 1 ) i sinZnU 2 (3. 3* 40) 

则€与7是相互浊立的# (0, 1) 随机数 • 

这样做法的理由让读者自行论证. 

[例 8] 若, 6) 服从二元正态分布（3.2.22)，其中七= 

0， a 2 = 0 •令 

= 6jCOsa + Isina ， rj z = — ^jsina + $ 2 cosa 


( 3 . 3 . 41 ) 
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这里 0< a <27：， 是某个角度 • 我们来求的密度函数 

q(u ， v). 

这里可直接用例5的结果.其中 J = l , 因此 


q(u ， v) —p (ucosa—vsina j wsina+pcosa) 

i* 




(Au 2 — 2Buv -\-Cv 2 ) 


其中 




cos 


一 2r 


cosorsma . sin 


戊 i 戊 2 





cosasina 


sin 4 a—cos 

°\ a i 


coscrsina 


a 


(3.3. 42) 



cosasina 



^ 1^2 


cos 2 a 


由 （3.3_42) 可看出由二维正态变量 （$, 匕）经坐标旋转而得的 
随机向量 （7 i ， ％)还是服从正态分布.进 一 步，若选 a 使得 


^ 2a = (3.3. 43) 

则 S =0, 因此％ 与％ 独立.这说明二元正态分布可经适当的坐 
标旋转化为两个独立正态分布之积.利用正交变换把多元正态分 
布化作独立正态分布之积，在数理统计中有重要应用. 


第三章小结 


. 本章中我们详細地研究了随机变量.用随机变量描述随机现 
象是近代概牟论中最重要的方法，以后我们所讨论的随机事件儿 
乎都用随机变量来描述. 

我们給出了随机变量的严格定义，桉照这种观点，随机变量 
是定义在样本空间上的具有某种可測性的实值兩数，只是出于历 
史的原因，才沿用“变責”二字. 

对于随机变量，重要的是要知道它取哪一些值以及以怎样的 
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概率取这些值.从这个角度讲，分布函数完整地描述了随机变量. 
同时，分布函数具有良好的分析性质，根便于研究，它是研究随 
机变量的重要工具. 

离散型随机变量与连续型随机变量是最重要的两类随机变 
量，由于它们的取值特征不同，因此对它们的描述及处理方法都 
有很大不同，应该进行对比，从而加深理解. 

我们还介绍了多种分布函數，而且比较注重各种分布函数的 
特征性质及它们之间的联系.这些分布函数在不同的理论和实标 
问題中扮演着重要角色. 

正态分布是概率论中最重要的分布，在应用中及理论研究中 
占有头等重要的地位，它与二项分布及泊松分布是概率论中最重 
要的三种分布.判断一种分布重要性的标准是： （1) 在实际工作 
中经常 遇到； （2) 在理论研究中重要，具有较好的性质； （3) 用 
它能导出许多重要分布.以上三种分布都满足这些要求. 

把几个随机变量放在一起研究时不但需要研究各个分量个别 
的性质，而且要考虑它们之间的联系，从而大大丰富了研究的内 
容，条件分布及独立性概念也随之出现，它们是条件概牟及事件 
独立性概念在随机变量场合的具体化，在今后研究中很重要. 

随机变責的函数的分布律的推导，在数理统计中及在概丰论 
的许多应用中相当重要.我们这里分三种类型介绍了最基本的处 
理方法. 这部分内容，只有通过动手多作练习，才能牢固掌搓. 

习题三 

1- 直线上有一质点，每经一个单位时间，它分别以概率 pAq 向右或向 
左移动一格，若该质点在时刻0从原点出发，而且每次移动是相互独立的，试 
用随机变量来描述这质点的运动（以&表示时刻《时质点的位置). 

2. 设$为伯努利试验中第一个游程（连续的成功或失败）的长，试求芒 
的概率分布. 

3. C 应取何值才能使下列函数成为概率分布： 
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(1) /(^) = ^ t A 二 1 ，2， …， A ^; 

X k 

(2) f ik ) ~C yj -. 是 =1， 2， …， A >0. 

kI 

4 -若分布函数定义为 F ( x ) =尸试证这时的 F U ) 具有下列 
性质： （ i ) 非降； （ ii ) F (一 03) =0, F (+00) =1; ( ill ) 右连续， 

5. 证明函数 


fioo ) 


ill 


2 A 


< x < 


> 0, ^常数 


是一个密度函数.这个分布称为拉普拉斯分布. 

6. 妊娠天数$的分布函数为 W (270, 100)，求 f 落在下列范围的 概率: 
( i ) (260， 280)； ( ii ) 短于250天； （ iii ) 长亍300天. 

7. 若 f 的分布函数为 W (60，9)，求分点 JCl ， 心， A ， jt 4 ， 使 f 落在 
(―°°， XI )，(^!, x 2 ), Gt 2 , jt 3 )， Cr 3 , x 4 ), ( x 4 , oo ) 中的概率之比为 7 : 


24 : 38 : 24 : 7 . 

^8* 在巴斯卡分布中，令试证当山 —0 时， 

\^—1/ 

它能用来逼近.(这可以解释为第 r ■次成功发生在 f + 

中的概率，其密度函数正好是参数为 r 的埃尔兰分布.用这种方法可以 
把课文中的对比严格化 .） 


9. 在生存分析中，作为研究对象的是非负随机变量，它们的分布称为寿 
命分布，若 f 是非负随机变量，其分布函数为 FU )， 密度函数为 / Gr ), 这 

时通常还引入生存函数 SGr ) =/^>1}及失效串函数 = •试 


导出 /( x ) 之间的关系式 • 

10. 设随机变量$取值于[0, 1]，若尸 { x ^< y } 只与长度 y — x 有关 
(对一切试证€服从[0， 1] 均匀分布_ 

*11. 若存在0上的实值函数 Q ( W 及 D 0) 以及 T Cr ) 及 ( o :)， 使 

/^(x) — exp{Q(6)T(x) + D{0) + S{x)} 


则称{/,， & e &} 是一个单参数的指 数族. 证明 （1) 正态分布 N ( m 。， V )， 
已知 m 。， 关于参数疗； （2) 正恋分布 N ( m ， al ) y 已知 a 。， 关于参数 m ; 
(3) 泊松分布尸 （ A ) 关于 A 是- 个单参数的指数族. 

但是[0,幻上均匀分布，关于0不是一个单参数的指数族. 

12. 定义二元函数 


F { x , y ) — 



x + > > 0 

工 + ：y < 0 
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验证此函数对每个变元非降，左连续，且满足 分布函 数性质 （ ii ), 但无法使 
(3,2.5) 保持非负- 

*13 - 试证 / ( z ， y ) =Ke 一 ^ 2 + 心^ 2 >为密度函数的充要条件为 “> 0 以 

^> 0 » h 2 — 虹〈0 ， K — ~ ^/~ac — b 2 . 

7 t 

14. 若 f 〗 ( r )， / 2 (： y ) 为分布密度，求为使/ ( x ，： y ) (j ) X 

/ 2 ( y )+/ z ( x ， y ) 成为密度函数， / i ( u ) 必须而且只须满足什么条件， 

15•若 （L 0的密度函数为 

f Ae^ <u ^ v) , 文 >0 ，夕 >0 

/ O ，）） = ( ^ " 

lo ， 其他 

试求： （1) 常数,4; (2) 尸 K <2, ?<lh (3) f 的边际分布； （4) P{e + V < 
2}; (5) / Cr |)) ; ( 6 ) P { e < 2 \ rj < A \. ' 

*16 •若 （$， 7 ) 服从二元正态分布，参数 〜， a 2 ， a 〖， 4， r ， 以 £) ( A ) 记 
下面椭圆的 内部： 

(x — a { y 〜 2r(jc — aQjy — a 2 ) + (y — a 2 Y 二又 2 

^1^2 <A 

试求尸{(夂 ？）eD ay }. 

17. 证明多项分布的边际分布仍为多项分希. 

18. 设二维随机变量 （I ?) 的联合密度为 

p{x ' y) ^ ra^k；)^~ Hy ~ xy2 " e ~ y 

ki ^> 0 9 k 2 ^>Of 0 < jr ^ 3 /< ^°°- 试求 $ 与 7 的边际分布 _ 

19. 若/』（ 1 )，/ 2 (^)，/ 3 ( 1 )是对应于分布函数巧&)，^(了），^(^) 
的密度函数，证明对于一切 a ( — 10 < 1 )，下列函数是密度函数，且具有 
相同的边际密度函数人（ X)，/ 2 U)， / 3 ( x )： 

fa (X" X Z ， X 3 ) 

—fl (-^l) fz (^ 2 ) fz ( ， 3) { 1 + ^ [2Fi (xi) —1] 

• LtF z (x 2 ) - 1 ] [2t\ ix,) - 1 ]} 

20. 若每次试验中出现 A ， A 2 , 戌的概率分别为 A ， 内及仏，而且/ 

+户 2 +九=1，共进行 n 次独立试验，以乞记 A 出现的次数，试求尸 {^ i - 
k\^ z — m). 

21 . ( 1 ) 若 （I ?) 的联合密度函数为 

f \ < 1, 1 
j (*r 9 y) ~ ( _ 

10 , 其他 
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问芒与々是否相互独立？ 

(2) 若 （G V )的联合密度函数为 

I Sxy 9 0 < z ^ : v ，0 < ^ < 1 

g ( x 9 y ) = 

10, 其他 


问芒与^是否相互独立？ 

22•设 （ f ， ？， f ) 的联合密度函数为 

/ 

(1 — sinxsinvsinz ) , 

p ( x 、 y ， z 、 — 

、0， 


0 ^ X ^ 2 ?r 

当 0< 夕 <2 疋时 
0 < 2 r < 2 ?r 

其他 


试证$， y , (两两独立，但不相互独立 • 

23 •设 （ f , W 具有联合密度函数 

^― ! » t^i < 1 ， w < 1 

p { x , y ) = < 4 

U ， 其他 


试证^与7不独立，但 f 与纩是相互独立的 • 

24* 若夂 7 相互独立且皆以概率 f 取值 +1 及 一 1 ， 令 r=h ， 试证夂心 
(两两独立但不相互独立. 

25. 若$与匕是独立随机变量，且(〜，/0, 每广 B ( jh ， p 、， 试 
直接证明 


( 1 ) 6 + 6 〜 B ( ⑴十 w 2 ，/>); 

(2) P {^i=^I6i+6 2 =w} ^ 



n 


26. 若6与6是独立随机变量，均服从泊忪分布，参数分别为1及 A : 


试直接证明： 

(1) 1 + 6具有泊松分布，参数为1 + ；^ 


I n \ ( X \ k { A \ n ~ k 
(2) P { Wl ㈣ :-心 - J (^) \ j ^ x 2 ) • 

\ J 

27 .设 f 的密度函数为 A d 求下列随机变量的分布函数 ：（1) 


(2) 7=4芒； （3) 户 旧 • 

28. 设 f 与7相互独立 - tl 服从同一几何分布 ， ，C = max Cf ， 7)，试求 
(1) O 的联合分布； （2) C 的分布；（3〉$哭于 C 的条件概率分布_ 


* 
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29. 若 专， 7为相互独立的分别服从 [0. 1] 均勻分布的随机变量，试求 
十7的分布密度函数. 

30. 设匕 ？ 相互独立，分别眼从 W (0, 1)，试求？=!■的密度函数. 

3 L 若 f ， 7是独立随机变量，均眼从 N (0，1)，试求(7 = 5+7 ， V = f 
一 7的联合密度函数. 


32. 若心，纟 2 , …， 夂相互独立，且皆服从指数分布，参数分别为 A ，々 


又"，试求7 = ruin (芒 1 ，$ 2 , 


* * ♦ 


U 的分布 * 


33•在（0, a ) 线段上随机投掷两点，试求两点间距离的分布函数. 

34. 若气体分子的速度是随机向量( X ， y ， Z ), 各分量相互独立， 


且均服从 N (0, 〃 2 )，试证 + P + 服从马 克斯威尔分布 


f ( s ) 



i eXP | 一 


2< t ! 


>0 


35. 设 X 是取正值的随机变量，若 hX 〜 W (/ i , A ， 试证 X 的密度函 


数为 


p ( x ) ^ < 


/2 n 


exp 


2^ 


(ln^ — fi) 


2 




这个分布称为对 数正态分布. 

36. 通称下列分布函数为 韦布尔 分布: 


j ： 〉0 

x ^ 0 


F ( x ) — 



x > 0 
x ^ 0 


这是韦布尔 ( Weibuli ) 在研究金属材料的疲劳寿命中导出的，在可靠性研究 


中有广泛应用. 


若匕 ，…， ^相互独立，相同分布，并以 er 记它们的最小值，则当 
6 〜 F ( X )时，试求的分布函数 * 反过来， 若 f 〜 F ( X )，试导出 f 的 


分布函数. 

链条的寿命取决于最弱环节，试说明上述概率结论的实际含意. 

•37. 设7为两个独立随机变量， f 服从# (0, 1)，？服从自由度为 


的尤 2 分布 （3. 3* 14)，令/ = 



试证 z 的密度函数为 



Pn(^) = 



\ -Ot+lV/2 



# 
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这分布称为具有自由度 / I 的 Z 分布，在数理统计中十分重要. 
•38, 若 f 与7独立，且^〜忒， V - Xl 试证： 


(1) $+7与音 . 独立; 

⑵+告的密度函数为 



> 0 

x < 0 


这个分布称为 F 分布. 

39* 若7独立，且均服从 W (0, 1)，试证+ 7 2 与 V = ■是独 

立的，并求出它们的密度函数. 

40. 若（夂 7) 服从二元正态分布（3_2. 22)，试找出$+7与$—7相互 
独立的充要条件. 

41. 对二元正态密度函数 


pix.y) 


2 兀 


exp 


(lx 


2 oty — 22 jt — 14 ：y + 65) 


(1) 把它化为标准形式 （3. 2, 22); (2) 指出〜，…， ct m 〜， (3) 求 

pi ( z ); (4) 求/^ (x \yh 

7 3 2^ 

42.设 fl = 0, ^ 3 4 1，试写出分布密度 （3. 2. 12) 并求出（$， 

«• 

2 12 , 

的边际密度函数. 

• M 3. 设 f 与 7 是相互独立相同分布的随机变量，其密度函数不等于 0 II 
有二阶导数，试证若$斗刀与 $—7 相互独立，则随机变量夂 I $丄？， 卜 V 
均服从正态分布. 

44. 把习题25和习题26的结果推广到;2 随机变量的场合. 

45. 设随机变量 f 与7相互独立， 卜 B ( n ， p 、， 而 7 服从（0, 1) 上均 
匀分布，试求 S + 7 的分布函数和密度函数* 

〃46.试求顺序统计量 Gg a </) 的联合密度函数. 

47. 试利用概率的连续性重新证明一元分布函数的性质 （ H ) 和性质 
( iii )， 并说明这种证法可推广到多元的场合. 

M8 . 利用随机变 t 分布解释卩 I 特朗奇论， 
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•若 / 是 D 上单值实函数，对 ACRi ，记 卜 efi : / ( co )6 
B ), 试证逆映照/― 1 具有如下 性质： 

⑴ / HU 氏）二二 U 广 U 凡）； 

keA 

⑵ /-](n 队） 二二 n / l uh )； 

Ae A Ae A 

(3) /■ J ( B ) =/ 1 ( B ). 

^ * 50 . 证明： f 是•个随机变量当 H 仅当对任何: rGR 1 , 成、〉： 

{ttl : ^(co) <： x) G ^ 

[提 示： 必要性是显然的，为证充分性，记 ni = M : ACIR 1 ，(^(^)6 
/ I ) 6.’}，验证 ttt 是 c 域，又 m 包全体形如（一 oo , I )的区间，故 m 
包含# !.] 
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第四章数字特征与特征函数 


§1. 数学期望 


一、 平均值与加权平均值 

有甲、乙两个射手，他们的射击技术用下表表出: 

甲射手 乙射手 


10 


击中环数 


10 




试问哪一个射手技术较好？ 

这个问题的答案不是一眼看得出的.这说明分布列虽然完整 
地描述了随机变量，但是却不够“集中”地反映出它的变化情况. 
因此我们有必要找出一些量来更集中、更概括地描述随机变量，这 
些量多是某种平均值. 

求平均值是大家都很熟悉的一种运算.例如，某公司有《个 
职工，他们的工资分别为 A ， x 2 , …， A ,则这个公司的平均工资 
为 



X! + 工 2 + …+ J0„ 

71 


(4.1. 1) 


还有其他求平均值的方法.例如，一个小学生，他的考试成 
绩为：语文95分，算术85分，常识60分，若依上面方法计算， 
则他的平均成绩为 ^=80. 显然，这个数字不太能反映这个学生的 
真正成绩，因为它没有考虑到这三个科目的相对重要性.在这个 
年级中，每周语文有10节课，数学有8节，而常识只有2节.在 




170 . 





评价学生成绩时，这个因素不能不考虑，因此用下面方法来计算 
学生的平均成绩，似乎更合 理些： 

- = 95 X 10 + 85 X 8 + 60 X 2 

10 +T+ 2 


10 




95 X - + 85 X - + 60 X 20 


87. 5 


这种平均称为加权平均.其一般定义 如下： 给定权 i 

n 

=1， 2， …， w ， 满足 则 

•I 4 


x w — ) ^jo 1 x x ( 4 . 1 . 2 ) 

i- 1 

称为 A ，： r 2 ， …， ： c „ 关于权 { w ,，2» n ) 的加 枳平均 

值. 

显然，在某些情况下，加权平均更加合理.由于“权”的大 
小直接影响最后结果，因此“权”的选择是加权平均中最重要的 
问题.例如为测量泰山的高度可以安排几个测量队从不同的地点 


进行测量，由于各个测量队的技术水平不一，各地点的地理条件 
不同，因此最后的结果恐怕要采用某种加权平均值为好. 

不言而喻，普通平均是加权平均的一种特例，这时所有的权 
相等. 


平均值按其大小总在原始数据的当中，因此它反映了一组数 


据的中心趋势. 

在上面的问题中，若使两个射手各射#枪，则他们打中的环 
数大 约是： 

甲： 8 X 0. 37 V +9 XO . IW + IOXO . 6 iV =9. 3 N 


乙： 8 X 0. 2 A^-f 9 X 0. 5 iV 4-10 X 0. 3 N =9. IN 

平均起来甲每枪射中 9. 3 环，乙射中 9.1 环，所以甲射手的技术 
要好些. 

因此，这里的计算公式为 

m 8 X + 9 X /> 9 + 10 X />10 
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这是对击中环数的加权平均，其权正好取为相应的概率. 


二、离散型场合 


受上面的问题启发，对一般离散型随机变量，我们可引进如 
下定义. 

定义 4. 1. 1 设专为 一离散型随机变量，它取值 A ， _ r 2 ，： r 3 ， 
…对应的概率为/，/>2, …如果级数 


> k ^ ip l (4. 1. 3) 

1 = 1 

绝对收敛，则把它称为芒的数 学期望 （mathematical expectation )， 

简称 期望、期望值或均值 （ mean )， 记作 

00 

当发散时，则说 s 的数学期望不存在. 

t 二 1 

定义中对级数要求绝对收敛是为了数学处理的方便.从直观 
上来讲，它也是合 理的： 因为诸 I ,的顺序对随机变量并不是本质 
的，因而在数学期望的定义中就应允许任意改变 X ,的次序而不影 
响其收敛性及其和值，这在数学上就相当于要求级数 （4.1.3) 绝 
对收敛. 


显然数学期望由概率分布唯一确定，以后我们也称为某概率 


分布的数学期望.下面来计算一些重要的离散型分布的期望值. 


[例 1] 伯努利分布事件 A 发生的概率为/> ， 若以 U 记其 
示性函数，即 A 发生时取值1，否则取值0,贝 IJ 

El A = 1 X /> + 0 X (1 — 户） 


= p = P(A) ( 4 * 1 . 4 ) 

因此概率 P 04) 是随机变量 1 a 的数学期望.从这个角度看，概率 
是数学期望的特例. 


[例 2] 


项分布 pk = 



k) 


p k q 





% mm 



m 
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n 


nP ^ 


k=] 


n — 1 

k — lj 


pk - 八 q n-k 


np(p + q) 


n - 1 


np 


泊松分布户 


A 务 


e A ， 々= 0， 1 ， 2, 


* 



oo 


•.X > 


2咏 = 




oo 


e 


X 


X k 




Ae-S 7 T ^ 


0 


* 


k=\ 


(々一 1)! 


Ae 


a 


令 


e 


A 


(4. h 6) 


由此看出，泊松分布的参数 A 就是它的期望值. 
[例 4] 几何分布 pk = q h — l p ， 6 = 1，2, 


攀攀攀 


<• X ) 




p = p(l + + 3g 2 + …) 


k 


p(g + f + 9 3 + …） 


P 


q 


1 — Q 


[例 5] 


= - = 一 

P (1 —q) 2 P 

随机变量 f 取值 A = (~ l)*y 


(4. 1. 7) 


是 =1 ，2，…对应 


的概率为九=去，则由于外>0, ^ p k = l , 因此它是概率分布， 

乙 k=i 

而且 

CXj oo 

工 kpk — ^] ( — 1)^ 4" = — ln2 

但由于 

ro CX^ 

k-- I ^ — 1 

因此 $ 的数学期望不存在. 

从上面例子看到，几种重要的离散型分布，其参数都可由数 
学期望算得，因此数学期望是一个重要的概念. 
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三、应用实例 


从上面讨论中可以看出，数学期望刻画了随机变量取值的某 
种平均，有明显的直观含意.在许多问题中，数学期望的概念甚 
至比概率和随机变量等概念更易被人理解和接受.在概率论发展 
的早期，人们更常用的概念和工具是数学期望.下面的例子将有 
助读者对这个重要概念的深入理解. 

[例 6] (押宝）押宝是赌博的一种，它以种种形式在世界各 
地流行，吞夺大量财富，现举一例以揭穿其本质. 

在我国南方流行一种称为“捉水鸡”的押宝，其规则如下：由 
庄家摸出一只棋子，放在密闭的盒中，这只棋子可以是红的或黑 
的将、士、象、车、马、炮之一.赌客们把钱押在一块写有上述 
十二个字（六个红字、六个黑字）的台面的某个字上.押定后，庄 
家揭开盒子露出原来的棋子.凡押中者（字和颜色都对）以1比 
10得到赏金，不中者其押金归庄家. 

为对这种押宝的实质有个了解，最好考察一个赌徒当他押上 
1元赌注之后的期望所得.显然其分布列为 


, 0 11 ; 

11 1 (4.1.8) 

[12 12j 


因此其数学期望为 

i 

1 1 

由于支出 （1 元）和期望收入元 j 不等，因此这是不公平 
的赌博，它明显对庄家有利.数学期望的概念帮助我们认请了这 


事实上，当一个赌徒走进一座赌场时，他面临的都是这种不 
公平的赌博，否则赌场的巨额开销和业主的高额利润从何而来呢? 
普及概率知识有助于杜绝赌博现象. 

[例 7] (彩票）彩票的发行，数额巨大，其实质如何呢？请 
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看一则实例：发行彩票10万张，每张1元.设头等奖1个，奖金 
1万元；二等奖2个，奖金各5仟元；三等奖10个，奖金各1仟 
元；四等奖100个，奖金各1佰元；五等奖1000个，奖金各10元. 
还是算算每张彩票的期望所得.这时分布列为 


10000 

5000 

1000 

100 

10 0 

1 

1 

2 

10 

100 

1000 

(4, 1.9) 

10 5 

20 5 

10 5 

10 5 

r vv 

10 s 



不难算出其期望值为 0.5 元，即大约能收回一半. 

在我国，类似的发行只有当收益主要用于公益事业时才允许. 
另外，有奖储蓄在保证储户基本收入的前提下，用部分利息摇奖， 
其分析方法类同. 

[例 8] (保险）这里主要问题是如何确定保险费.在保险学 
中，收取保险费的原 则是： 被保险人交的“纯保险费”与他们所 
能得到的赔偿金的期望值相等. 

因此，若出事的概率为/>，有 N 个人参加保险，则每人交的 
纯保险费 a 与出事赔偿金心应有下面关系： 

N 

Na= Y\p k a - p) N k ^ kb 
即^1=/^，正如所预期的. 

保险的种类繁多，但上述原则不变，因此保险费的计算离不 
开概率论. 

[例 9] (投资之决策）投资总具有一定风险，因此在选择投 
资方向时，计算其期望收益常是可供考虑的决策方法之一.下面 
是一个大为简化的例子. 

某人有10万元现金，想投资于某项目，预估成功的机会为 
30%，可得利润8万元，失败姑机会为70%,将损失2万元.若 
存入银行，同期间的利率为5%,问是否应作此项投资？ 

以 f 记投资利润，则 

= 8 X 0. 3-2 X 0. 7 = 1( 万元） 
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而存入银行的利息为10 X 5% = 0.5( 万元），因此从期望收益的角 

度看，应选择投资，当然这时要冒一定的风险. 

[例 10] (—种验血新技术）在一个人数很多的单位中普查 
某种疾病，#个人去验血.对这些人的血的化验可以用两种办法 
进行 .（1) 每个人的血分别化验，这时需要化验 W 次； （2) 把々 
个人的血混在一起进行化验.如果结果是阴性的，那么对这々个人 
只作一次检验就 够了； 如果结果是阳性的，那么必须对这々个人再 
逐个分别化验，这时对这々个人共需作々十1次化验.假定对所有 
的人来说，化验是阳性反应的概率都是 化而 且这些人的反应是独 
立的.我们来说明在 P 相当小的场合，采用办法 （2) 能减少化验 
的次数. 

若记 g = l — />，则々个人的混血呈阳性反应的概率为1 一 〆 ， 
用 （2) 的方法验血时，每个人的血需要化验的次数$是随机变量， 
其分布列为 ^ 

T 1 + f 

\-q k , 

因此 

^ 1 4~ ^ (1 — g k ) - 1 — +士 

w 个人需要的化验次数的期望值为 iV(l —y + l ，当 / — 1>0 

时，就能减少验血次数.例如当 /) = 0. 1时，取々 = 4,则 ¥ — = 

0. 4 .用 （2) 法平均能减少40%的工作量.显然 f 愈小，用这种 
方法愈有利.当声已知时，还可以选定整数心，使权达到最小， 
把々。个人分为一组就最能节省化验次数. 

四、连续型场合 

下面我们转入考虑连续型随机变量的数学期望.设随机变量 
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芒有密度函数(工），取很密的分点^。<工1<工2<〜<^，则芒落 
在 O ,， x , u ) 中的概率近似地等千/> ( X ,) Cr , +1 — X ,)， 因此€与 
以概率/> U ,) U , + 1 ~ x f ) 取值: r , 的离散型随机变量近似，而这离 
散型随机变量的数学期望为 




i ) 


上式是积分 


x /> Cr ) cb : 的渐近和式，这个直观的考虑启发我们 




引进如下 定义： 

定义 4 . 1.2 设 S 为具有密度函数户 Cx ) 的连续型随机变量， 


当积分 


#(： T ) dx 绝对收敛时，我们称它为$的数 学期望 （或 


CX ： 


均值），记作五 h 即 




xp(x)dx 


(4. 1. 10) 


显然这里定义的数学期望也只与分布有关.下面计算一些重 
要的连续型分布的数学期望. 


[例 11] 正态分布 W (“ ^). 




n. 


xp{x)dx 




-ix-aVKZa 1 


oo 


/2 


wJ 


v2ncr 




dj ： 


2 / n 


)e^ z /2 d 之 


o. 




/2 dz 


(4 - L 11) 


可见（心中的参数 a 正是它的数学期望 • 
[例 12] 指数分布/> Cr ) 


x\e^dx 






j：de 




•/ 




“ cb : 




A 


(4.L 12) 


im 13 
由于 


柯西分布 ( x ) 


l + x : 


• m ， 



# 


7r(llx z ) dx = 0 ° 

因此柯西分布的数学期望不存在. 

五、 一 般场合 

我们已经对离散型随机变量及连续型随机变量分别定义了数 

学期望，现在自然希望找到一种能适合一切随机变量的数学期望 

定义，并把上述两种情况作为特例.为了做到这点，需要利用斯 
蒂尔切斯 （ Stieltjes ) 积分 

若随机变量$的分布函数为 F Cr ) ，类似于连续型随机变量的 
场合，作很密的分割 〈… 0„，则彡落在 [： r , ， ： c , + i ) 中 
的概率等于 FU +1 ) — FU ), 因此 f 与以概率 FU +1 )— FU ) 取 
值^的离散型随机变量近似，而后者的数学期望为 

y^j：,[F(：r, 41 ) — F (x,)] 

I 

注意到上式是斯蒂尔切斯积分 P ■ rdFCr ) 的渐近和式，这启发我 

4 …- OO 

们引进如下 定义： 

定义 4. 1.3 若$的分布函数为 F ( x ), 则定义 

E $ = xdF ( x ) (4* L 13) 

^ — 00 

P 

为芒的数学 期望. 这里我们还是要求上述积分绝对收敛，否则数学 
期望不存在. 

关于斯蒂尔切斯积分 . 

/ = g ( x ) dF ( x ) (4. L 14) 

J 一 OO 

我们仅列举它的如下 性质： 

①如果读者不熟悉斯蒂尔切斯积分而又希望对 它有所了解， 可参看复旦大学数 
学系，实变数函数论与泛函分析概要（第二版），上海科技出版社，1963,第四章. 
不过，为读懂本书其余部分 • 只要承认后面所述的少数事实就可以了. 
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( i ) 当 FOc ) 为跳跃函数，在 a 0-1, 2,…）具有跃度 A 时， 
上面积分化为无穷级数 

1 = 2芨⑹九 

ri 

t 

( ii ) 当 FCr ) 存在导数 F ( x ) = /> Cr ) 时，积分 U . 1. 14) 化为普 
通积分 

'oo 

1 — g { x ) p { x)dx 

J 一 oo 

( iii ) 线性性质 

\_ agxix ) + bg 2 { x )~\ dF { x ) 

J — OO 

= a g i ( x ) dF ( x ) + b g 2 ( x ) dF ( x ) 

J — OO J 一 CO 

( iv ) 

g-(x)d[aF l (j：) + bF 2 (x )] 

J — OO 

= a g ( jc ) dF x ( x ) + b gix)dF zix ) 

J ™ oo J ― ► oo 

( v ) g ( x ) dF ( x ) — g ( jo ) dF ( x ) 4 - g ( x ) dF ( x ) 

J a J a J € 

( a ^ c ^ b ) 

( vi ) 若 g ( z )>0， FCr ) 单调不减， 6> a ，则 

g ( x ) dF ( x ) ^ 0 

J a 

从前两个性质，我们知道定义式 （4.1.13) 的确能包含 
(4.1. 3) 及 （4. 1. 10) 作为特例. 

六、随机变董函数的数学期望 

下面讨论随机变量的函数？(幻的数学期望的定义，这里 
尽 Or ) 是一元博雷尔函数，从上章§ 3的讨论已知 V 是随机变量.通 
过类似于引进 (4.1.13) 的推理，似应定义发 ( O 的数学期望为 
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Eg (^) = g ( x ) dF ^( x ) (4. 1. 15) 

J 

这里当然还是要求这个积分绝对收敛. 

但是，另一方面，因为7是随机变量，也有分布函数，记之为 

I 

心( X )，则按一般随机变量数学期望的定义式 (4* L 13) 又应有 

£7 = f y ^ F ^( y ) (4. 1, 16) 

J 

因此，这两个积分应该相等.事实上，这两个积分的确相等，我 
们把这个事实写成定理的形式. 

定理 4. 1. 1 若 g ( T ) 是一元博雷尔函数，而芒），则 

广 oo 

ydF v { y ) = g ( x ) dF ^{ x ) (4. 1- 17) 

J ^ 00 — oo 

即这两个积分中，若有一个存在，则另一个也存在，而且两者相 

等. 

这个定理的证明要用到积分论，超出了本课程范围.我们只 
能列出结论，并指出它的重 要性： 一 方面，它消除了随机变量的 
数学期望定义中所出现的表面矛盾；另一方面在计算随机变量函 
数的数学期望时也带来很大的方便，我们无须先计算7的分布函 
数尽 ( W 再求其数学期望，而可以直接从 f 的分布函数 F f (: r ) 出 
发利用 （4.1.15) 来计算 • 

公式 (4. M 5) 有十分明显的直观解释.在离散型场合，公 
式 (4.1.15) 化为 

Eg ($) = (4.1.18) 

/ — 1 

我们以一个浅显的例子来说明它的含意. 

某零售商店出售某种小商品，每销售一件可赚 L 5元，关心 

•» 

的是它的利润？.由于利润与销售量 f 成正比，因此要知道销售 
量.比较合理的做法是假定$为随机变量，服从一定分布.为简单 
起见，假定每天卖出0, 1，2, 3件的概率分别为 0.4, 0.3, 0.2, 
0.1. 这时希望计算平均利润 
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第一种计算方法是把7看作随机变量，求出其概率分布，再按 

一般数学期望公式计算，这时7的分布列为 

j 0 1.5 3 

1 0.4 0- 3 0. 2 0, 1) 

因此 


£7 = 0 X 0. 4 十 1. 5 X 0. 3 + 3 X ()• 2 + 4. 5 X CK 1 

~ 1* 5 (7 C ) 

这种算法就是按公式 （4. 1. 16) 的思路进行的. 

另一种算法把 7 看作$的函数 7 = 1. 5$，由于 S 的分布列早就 
知道为 


0 ‘ 


0. 3 0.2 0. 1 


因此按（4.1.]8)式（也即按 （4. 1.15) 式） 

Ey ) = £(1. 5^) = 1. 5 X 0 X 0. 4 + 1. 5 X 1 X 0. 3 + 1. 5 X 2 

X 0. 2 + 1. 5 X 3 X 0. 1 


=1. 5( 元） 

正如预期的，两个答案相同，这也为定理 4.1.1 提供了例证， 
下面的例子更接近于实际，不过其方法实质是一样的. 

[例 14] (报童问题）设某报童每日的潜在卖报数 （ 服从参 
数为 A 的泊松分布.如果每卖出一份报可得报酬 a ，卖不掉而退回 
则每份赔偿 6. 若某日该报童买进《份报，试求其期望所得.进一 
步，还要求最佳的卖出份数 

[解]若记其真正卖报数为彡，则$与（的关系 如下： 

\n f O 乃 


这里的 f 服从截尾泊松分布，即 


P{$ = k} 


Y \ 


e 


k <i n 


^ y 

2j 7 




k 
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记所得为 7, 则 7 与$的关系如下 




an 


-j 、 
■ ， 


$ — b{n — 芒 ），$ <C n 


因此由 （ 4.1.18 )， 期望所得为 


M{n) = Eg($) 


Z ~^lka - (n 




k ) b 3 





X k 

k ] 


e" A na 


-2 


(a + b)A ^> : 


(a H - 古)2 




A 


+ na 


_ 




这个问题的最终解决是当 〜 6, A 给定后，求 n 使 M 00达 
到极大，这是一个典型的最优化问题，也是报童问题的正确解. 


般计算泊松分布的部分和可用下列公式 


S 


A A 




々！ 


X 




% 1 

Jo 


A r 

roo 




rxo 


rx 

y 一 1 

Jo 


y dy 


(4. 1. 19) 

其数值可在数学表中査到.公式 （4.1.19) 是埃尔兰分布的一个 
应用，也可直接证明。 

另一重要的特殊情况是$具有密度函数/> Or ) 的场合，此时 

Eif = Eg(^) — g(x)p(x)dj ： (4.1.20) 

J — oo 

这个结论经常用到.下面是一个例子，这个例子也顺带说明可以 
利用随机变量的期望值来作出某种最优决策. 

[例 15] 假定在国际市场上每年对我国某种出口商品的需 
求量是随机变量 f (吨），它服从[2000, 4000] 上均匀分布.设 
每售出这种商品1吨，可为国家挣得外汇3万元，但假如销售不 
出而电积于仓库，则每吨需浪费保养费1万元，问题是要确定应 


组织多少货源，才能使国家的收益最大？ 

若以 y 记预备某年出口的此种商品量（显然可以只考虑2000 


<夕<4000的情况），则收益（单 位： 万元) 


7 = H ($) = 


|3 ： y ， 当 时 

U 芒 ~ (y- 当 f <7 时 
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为了求得 E V ， 利用公式 （4, 1.20)， 


£7 } = 


J 




H ( jr ) p ( x)dx = f H ( x)dx 

cyJKJVJ 2000 


2000 




2000 


(4^r — y^dx 



2000 

1 f4000 


2000 


3 ydx 


1000 


C — 


2 



7000 y — 4 X 10 6 ) 


此式当 ^=3500 时达到最大，因此组织 3500 吨此种商品是最好的 


决策. 


七、 多维场合 


可以把上面结果推广到随机向量的场合，若（$，…， 0 的 
分布函数为尸(々 ，…， xj ，而以文 】 ，… ， a ) 为 h 元博雷尔函数， 


则 


E g (^， …， 


/*oo 


发 O! ， …，: OdFCTi 


^ n ) 


特别地， 


CXJ 


» • * 


，…， ： r ") 


其中是乞的分布函数. 


fK 


JT 


idF } ( jr x ) 


般地，引进如下定义 


E$ 2f 


定义 m 随机向量 n 2 ，… ，二） 的数学期望为 说， 


f 其中 




/*oo 




:/dF(x 】 ， … ,x„) 


x . dF . Cx ,) 


* • « 


n 


鲁 


这里 (;) 是 6 的分布函数 （ z .= i , 2, 

因此一兀正态分布（ 3 . 2.22) 中的参数（％， a 2 ) 正是随机向 
量的数学期望. 

八、数学期望的基本性质 

性质 1 若 ， 则 a d 分. 特别地 £ c = c , 这里 a ，办， 


c 是常数. 


性质2 线性 性质： 对任意常数 z - 


1， 


• * * 


， n 及 b ， 有 


蠢 
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參 



n 


十 b) = + b 

/ ; 1 } — 1 

这两个性质的证明是明显的.性质2对数学期望的计算很有 


好处 • 


[例 16] 求超几何分布 


P 


/Ml 

N - 

\ m \ 

' n —— mi 


^ N\ 


^ n ! 


0，1， 


• • » 


的数学期望. 


n 


当然可以用乏直接求出，但也可用下面方法来计算. 

i — 0 

设想一个相应的不放回抽样，令 




1， 第 〖次抽 得废品 
0，第 f 次抽得好品 


则尸 {^=1} 


等， 因此段, 


M 


3， 而 f =$+…+乞表不”次抽 


样中抽出的废品数，它服从超几何分布，利用性质2得到 


£芒=從+…+從 




nM 

at 


2. 方差，相关系数，矩 


一 、 方差 

■ 

数学期望是随机变量的一个重要数字特征，它表示了随机变 
量取值的平均水平，从一个角度描述了随机变量.但是从下面例 
子马上可以看出，单用数学期望描述随机变量通常是不够的. 
再考察两个射手，他们的射击技术用下表 表出： 


丙射手 丁射手 


击中环数 

8 

1 

9 

1 

1 

10 

击中环数 

8 

9 

10 

概 率 

0. 1 

0.8 

. | 

1 

. I 

0_ 1 

1 

概 率 

0, 4 

0, 2 

0_ 4 
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显然，他们每射一枪的期望值都是9环.不过，他们之间的 
技术差异是明显的，有必要进一步刻画. 

细察之下发现，丙射手的射击大部分集中在均值9环，而丁 
射手则散布度比较大. 

一 般地，当我们考察一组观察值 A ， J ：2 ，…， J ：„ 时，其平均 
值给予我们一个关于这组数据中心的表征.接下来我 

f 1 

们注意的便是这组数据对于平均值的偏离，也就是 A— 王， 

当然我们也想用一个数字来刻画这种偏离.首先想到 
的可能是把这些偏离值求和，但是马上发现这是没有意义的，因 

n 

为 Z H ) ^0,这是平均值的性质之一，它来自正负偏离相 

r = 1 

互抵消.这时可供选择的指标有两个， 一 个便是平均绝对偏差 

AD = — \ xi — x | 

可惜，这个量从数学上不太容易处理，因此最后还是让位于另一 
个指标 一- 方差 

CT 2 = 丄文) (X, — X ) 2 

上述讨论容易过渡到带有“权”的场合，从而到离散型随机 
变量的场合，即对于数学期望的偏离的平方的加权平均 

n 

2 U — EXYp , 

i = l 

这些直观讨论启发我们引进如下 定义： 

定义 4. 2.1 若£($—存在， 则称它为随机变量 f 的方 
差 (variance), 扦记为仅，而称为根方差、均方差或更多地 
称为标准差 (standard deviation ), 

利用数学期望的线性性质， 

z)e = e (? - = Eie 2 — • £ 芒十（從 ） 2 ] 

= Ee — 2 E $ - e $ + (Eer = e ^ 2 - ( e$) z ( 4 . 2 . d 
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方差描述了随机变量对于其数学期望的离散程度，在概率论 
和数理统计中十分 重要. 例如本节开头讨论的丙、丁两射手，丁 
射手的方差大，即技术不够“稳定”；而丙射手方差小，较“稳 
定”.这与习惯看法是一致的. 

当然方差也由概率分布完全确定.下面计算一些重要分布的 
方差，为书写方便，一律假定相应的随机变量为乞 
[例 1] 伯努利分布 




I 2 . /> + 0 2 • (1 — />) 




仪 = EP — {E^y = p — p z = pq 


(4. 2. 2) 


[例幻 


项分布 


E $ 2 = ^ k 2 \ n ) p k q n - k = npq -\- n 2 p 2 


0 


D ^ = E ^ 2 — ( E $) 2 = npq J rn 2 p 2 ~ n 2 p 2 = npq 


(4, 2. 3) 


[例 3] 泊松分布 


Ee 


■ o 一 

^7 k 2 Pk = 

k -^0 k ^ } 


2 


« 


k ] 


：>) 




A * 

(々一1)! 


A 


A — 0 


k \ 


AH-A 


D^=E^ 2 -(Eey=x 2 +x-x 

[例 4] 均匀分布 J [ a , 幻 


(4.2,4) 


b 1 」 b^ru 

X 7 - = — ~ 

o—a 2 


(4. 2 - 5) 




n b 


u 


X2 b ^ a Ax 


b Zj rab-\-a 


De = E $ 2 -( E $) 


b 2 -\-ab-\-a 2 ( b-\-a 


( J ? — <2 ) 
12 


(4.2.6) 


[例 5] 正态分布 WU ， a 2 ) 


D 爸 


(x — a ) 2 - e 




djc 


» 
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— — i~-ze' z2/Z ) + e_* 2/2 cU 

I 一 oo J — _ 

= -^rz/2^ = (T 2 (4.2.7) 

/2tt 

这样，我们阐明了正态分布中第二个参数 a 的概率意义，它就是标 
准差； 而正态分布也由它的数学期望及标准差唯一确定. 

下面讨论方差的性质 
性质1 常数的方差为 0. 

性质2 这里 c 是常 数. 

性质3 £>(6^)=<: 2 汉，这里 c 是 常数. 

对于随机 变量夂 若它的数学期望£：$及方差汉都存在，而 
且 D $>0 , 有时要 考虑标准化了的随机变量 

$ ~ /m 

显然£^=0, 这正是称 r 为标准化随机变量的理由. 

性质 4 若 (: 关 £ 芒，则 D$<E(,e-cy (4. 2.8) 

[证明]因为 

D ^ E ^- E ^y =E ^_ c y_ (c _ E ^y (4.2.9) 

这个性质表明数学 期望具有一个重要的极值性 质：在 
£(芒 一 c ) 2 中，当 (: 时达到极小；这也说明在汉的定义中取 c 
= E $ 的合理性. 

二、车贝晓夫 (MefibHiies) 不等式 

概率 论中有许多不等式， 下面的车贝晓夫不等式是其中最基 
本和最重要的一个. 

车贝晓夫不等式 对于任何具有有限方差的 随机变量纟，都 


有 
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P{\e-E$\^e}^ 


( 4 . 2 . 10 ) 


其中 e 是任一正数. 

[证明]若 FCz ) 是 芒的分 布函数，则显然有 

D$ = P (x-Ee) 2 dF(x) 


> 


n 


(工一 




r* 


e 2 dF(x) 


lx- 




e z P {\e-E$\^e} 


( 4 . 2 . 11 ) 


这就证得了不等式 （4. 2. 10). 有时把 （4.2.10) 改写成 


P{\e-Ee\<e}^l- 




(4* 2, 12) 


或 



f - 莰 

很 




(4. 2. 13) 


车贝晓夫不等式利用随机变量^的数学期望£6及方差 
/对$的概率分布进行估计.例如 （4. 2_ 13) 断言不管$的分布是 

什么， 芒落在 （砑一4, 财 + M ) 中的概率均不小于 1 — 因为 

车贝晓夫不等式只利用数学期望及方差就描述了随机变量的变化 
情况，因此它在理论研究及实际应用中都很有价值. 

从车贝晓夫不等式还可以看出，当方差愈小时，事件 
{ |多一的概率也愈小，从这里可以看出方差是描述随机变 
量与其期望值离散程度的一个量，这与我们以前的理解完全一致. 

特别地，若汉=0 ,则对任意 e >0, 恒有 P { R — 财|> £ }=0, 
因此关辟卜0,即尸所以方差为零的随机变量 
是常数. 


三、相关系数 

对于随机向量 fn …，灰），定义它的方差为 ⑼” 
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…， 


方差反映了随机向量各个分量对于各自的数学期望的离散程 
度，它对于了解随机向量的分布有一定帮助.但对于随机向量，我 
们除了关心它的每个分量的情况外，还希望知道各个分量之间的 
联系，这光靠数学期望与方差是办不到的.下面引进的量则能起 
这个作用. 

定义 4. 2. 2称 

b,j 二 cov($, —£^ ( ) (^― 

~ = 1 ， 2,…， w (4. 2. 14) 

为芒/与心的协方差 （ covariance ). 

不难验算 

cov(Uj) = E^j—E 每 i * E 专 j (4. 2. 15) 

n n 

D(^) = ^D^2 S cov(H) (4* 2. 16) 

i — 1 1 l«J<n 

特别地 

D($-h^) = D^-hD7/+2cov(^ 9 ^) (4. 2* 17) 

方差是协方差的特例，显然匕=1^，矩阵 





… b ln 

^21 

A A 1 

bn 

… b z „ 

b n \ 

b n i 

… b nnj 


(4. 2- 18) 


称为5的 协方*矩阵， 简记作 Df ， 显然这是一个对称矩阵. 
此外，对任何实数0()=1，2, …，; 1) 有 



— E^j) ) tLF(x”". ， x«)= EM，》 0 


因此办是一个非负定矩阵，所以若以 detiH 己1?的行列式，则有 

detB^O 

更常用的是如下“标准化” 了的协方差. 




189 . 




定义 4, 2. 3 称 




cov d $ j ) 


(4 - 2. 19) 


为乞与 t 的相 关系数 (correlation coefficient) ，这里当然要求 
与不为零 .相关系数也就是标准化的随机变量与 




的协方差. 


以后定义常数与任何随机变量的相关系数为 0. 


因此 


[例 6] 多项分布 (3. 2. 6) 

显然，6〜 5(w，A)“ = l ，2,…， r. 因此 

E^i — npi j D^i = npi (l—pi) 

为求协方差或相关系数，可用下面 技巧: 注意到 

芒,+芒) 〜 5(打，/>,+/>>) 


= n (/ >, + />>) * D( 色 + 6)) — n ( pi -^ pj)(l — pi ~ pj ) 

由于 

/Xf + 1) = De, ++ 2cov (d) 

= npi (1 — pi) — 九） +2cov(6, ，安 /) 

可以得到 

covi^i^ — —npipi (4. 2* 20) 

相关系数为 

r __ —piPi __ 

r U — I - 

v AAd-AXl-^) 


p t pi 






现在讨论相关系数的性质.因为相关系数只与两个随机变量 
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有关，下面讨论将假定这两个随机变量是$与7,它们的相关系数 
记为 r . 

先证明一条常用的定理. 

定理 4. 2. 1 (柯西一施瓦兹不等式） 对任意随机变量彡与 V 

都有 

|£^1 2 <获 2 、五 V 2 (4.2.21) 

等式成立当且仅当 

P { 1=t ^)^l (4. 2. 22) 

这里^是某一个常数. 

[证明]对任意实数 b 定义 《(/)=£ (乂一7) 2 1 2 從 2 —公丑幼 
+於 f ， 显然对一切因此二次方程 u ( t ) = 0 或者没有实 
根或者有一个重根.所以 

lE^rjJ-E^ - £7 2 <0 

这正是 (4. 2. 21). 此外，方程 a(O = 0 有一个重根^存在的充要条 
件是 


lE^J-E^ 2 Er/ z = 0 
这时 五 ( V — 7〉 2 = 0,因此 

•PUof—7=0} = 1 

这就是 a 2. 22) 式.定理 证毕. 

由定理 4. 2.1 立即可以推出，若两随机变量的方差存在，则 
它们的协方差也存在. 

把定理 4. 2. 1 应 用到随机变量及可以得到相关 

/ D ? /Dri 

系数的如下重要 性质： 

性质 1对相关系数 r ， 成立 

|r|<l (4.2.23) 

并且 r = l 当且仅当 


6 —— yj — 




/ Dtj 


(4 - 2.24) 
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而 r 


1 当且仅当 




| £芒 

p \~7 m 

性质1表明，当广=±1时，$与7存在着线性关系，这时如 
果给定一个随机变量之值，另一个随机变量的值便完全决定. 

有线性关系是一个极端，另一个极端是 r =0 的场合.为此我 
们 引进： 

定义 4. 2. 4若随机变量 f 与 V 的相关系数 r -0, 则我们称6 

与7 不相关. 

性质2 对随机变量^与下面事实是等价的： 

( i ) cov (汔， 7) =0； 

( ii ) f 与7不相关； 

( iii ) E $ v = E^Eyi 

(iv) D^+rj)=D^+Dr). 

[证明]显然 ( i ) 与 ( ii ) 是等价的•由于 

cov ( 多， 7) =£( 芒一 £ 芒）（ 7— Etj) = E^~E$ • Et) 

因此 ( i ) 与 ( iii ) 等价.又由于 


7-£7 

/m 


(4. 2. 25) 


ZX 芒+7)=丑(芒一找+7— E 7) 2 = Z ^+ D 7+2 cov ( f ， J 7) 

因此 ( i ) 与 ( iv ) 等价. 

独立性和不相关性都是随机变量间联系“薄弱”的一种反映， 
自然希望知道这两个概念之间的联系.首先，我们有 
性质3 若 S 与 7 独立，则$与 7 不相关. 

[证明]我们只对连续型随机变量给出证明. 

因为$ 与 3 ? 独立，故其密度函数因此 


cov (芝，7)= 


')0 

(x— E$) (y— p{jo ^y)dx dj / 

--- oo 



(x — E$)p l (x)dx • (y—E^)p 2 iy)dy=0 



结合性质 2 及性质3,可以得到，若 f 与 7 独立，则= Ee - 
£7及 i )( f +7) = ^ + ^7 成立，同样的论证可以证明这个结论在 


争 
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n f 随机变量的场合也成立，即若…， 乞是相 互独立的随机 
变量，则 


乞二五芒1芯尽2…五夂 (4. 2* 26) 

D (匕 +6 +…+乞 ）=Z^+Z^ 2 + …十乃多” (4. 2.27) 

由独立性可以推出不相关性，但是反过来是不成立的，试看下 




[例 7] 设 0 服从[0,2 7 C ] 均勾分布 ，6 = cos 0，7 = cos (0+ “）， 
这里 a 是定数.我们有 


E ^ = 


n 




「 2 冗 


0 


cost dt = 0,Erj 


K 


2n 


cos(t~\~a )d^ — 0 





2n 


0 


COS 


2 


t d，= +，£7 2 = 


7 T 




cos 2 (t^a)dt = 



E^rj 



1 

cost cos{t-\-a)dt—~cosa 
J 0 L 


因此 


当 a = 0 时 f r= 1,^—7 
当 a = 7T 时 ，r= — 1 ，芒二 


r = cosa 

-J 存在线性关系* 


但是，当 a = | ■或 ¥ 时，这时 f 与7不相关.不过，这时却有 


芒 2 +7 2 = 1，因此$与7不独立. 

这个例子给我们：（1)提供了 r =± l 之例； （2) 提供 r = 0 之 


例； （3) 说明不能由不相关性推出独立性; (4) 说明即使 f 与7不相 
关，它们之间也还是可能存在函数关系.事实上，相关系数只是 ^ 

与 V 间线性关系程度的一种量度. 

不过，在一种重要的特殊场合-一正态分布，独立性与不相关 
性却是一致的.我们先对二元的场合来讨论这个事实. 

为此，我们先求二元正态分布 (3. 2. 22) 的相关系数. 

b 12 = (x — a] )(j， 一 a z )p{x^y^ dx dy 

^ ■— v / ■■■o 
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2 K(7 L tj 2 r 2 

•(: V — a 2 ) exp | — 


— { y — a ^ ) /(2^ 0 ) 


dy 


(x — a } ) 


2(1 - r 7 ) 






djr 


作变数变换 


1 — 


9 


^1 


" V 卜 V ’则 


{a x a 2 — r 2 tz + ra x a 2 t z ) e~T _ T dz dt 


- c：o J 一 c>o 


r < Jia 2 


t 2 e^ 2/z dt 


z 2 /2 


dz + 


vl 


e" f n dt 


z e 


士 n 


d 之 — - (J 2 


因此 


r\z 




(4.2. 28) 


这样说明了参数 r 是二元正态分布的相关系数. 

至此，我们已经完全搞清了二元正态分布中各个参数的含义. 
A , a 2 分别是两个边际分布的数学期望，而■则以下列形式 
构成它的协方差矩阵 


r < J x a 2 


(4.2. 29) 




另外，在上章§ 2 例 4 中已指出，二元正态分布场合，独立的 


充要条件是 


0,这 表明: 


性质4对于二元正态分布，不相关性与独立性是等价的. 

在§ 6中，我们将把这个结果推广到多元的场合. 

下面，我们给出一个边际分布是正态分布而联合分布不是多 


元正态分布的例子. 

_⑽士 


xV 2 


一 oo<Cr< 


g(x) 


COSX ， \x I <C7t 

0 ， \x\^7T 
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丄 2 

+ —e _,T g(x)g(y ), —co 〈 : ( ：， 3^〈°° 

关于 A Cr ，_ y )， 不难验证 ：（1) 是二元密度函数； （2) 边际分布 

都是正态 分布； （3) 相关系数为0; (4) 不独立； （5) 不是二元正 

态密度函数.这狴留给读者作为练习. 

[在抽样调査中的应用]抽样调查 （sample survey ) 是社 

会经 济中用 得最多的统计方法.在 国外， 上至总统竞选前的民意 
调査，下至针对家庭的家计调査，十分普遍.最近几年，我国也 
已经进行了不少有效的抽样调査. 

为对总体的某个指标（主要是总值、平均值、比率和百分 
北）进行估算，特设计某种抽样方案，以随机的方式抽取若干个 
体作调査，利用所得数据算出估计值，并希望给出估计的精度.这 
是抽样调査的大意. 

最简单也是最基本的抽样方式是所谓简单随机抽样，这时总 
体的 W 个个体中的每一个在一个大小为 w 的抽样中有同样的机 
会被抽到. 

下面的例子可以概括水稻产量、家庭收入、收视率等等具体 
情况，采用的是简单随机抽样. 

[例 9] 袋中有 JV 张卡片，各记以数字 h ，…， 

不放回地从中抽出 n 张，求其和的数学期望与方差. 

[解]取一张时，其数字的均值及方差分别为 

JV 

(4.2,30) 

| — 1 
及 

1 N - 

(Y-yy ( 4 . 2 . 31 ) 



抽豊放步片 j 的数字二 JL 


* 
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N ， 




1，2, … ， N ， z‘ = l，2，-" ， 


因此 


D^i = a 2 


所以 


E% = £：$ + £1 + … + £ 乞 = 


(4.2.32) 


T\ 


抓 = 2 说 + 2 2 cov(H) 

= na ZJ rnin~ 1 )cov(f l ，芒 2 ) 


(4. 2. 33) 


这里用 


在 (4. 2. 33) 中令； 2 = 7 ^这时 〜. = yH + … 是一个常 


数，因此= 0，于是 


iVV+iSKAT—l)cov(H) = 0 


所以 


cov ( H ) = — 


N-l 


(4. 2. 34) 


最后得到 


D^ln —n<J 2 — 


(?J — 1 )^T 

N-l 


nCN-n) 2 

"■f 1 ■ /T^ 

— N-l 

与有放回抽取的方差 m 2 相比，多出了一个因子 


(4. 2. 35) 


N — n 

M 一 1 


，称为有限 


修正因子 .当 


1时，它等于1;而当 n = N ^. 它取值为 0. 在 


不放回场合，添加抽取的信息量较大，即方差小，这与直观完全 
符合. 


特别地，若取1=丫 2 


Ym = 1 f YAd 


+ 1 


■ •鲁 


>V = 0, 则可 


以得到超几何分布的均值和方差的表达式. 

[现代证券组合理论]马库威茨 （ Markowitz ) 在50年代 
引进的均值一方差模型成了现代证券组合理论的基石.在这个理 
论中，假定有〃种证券可以投资，并把它们的收益率看作是随机 


« 
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变量，通常记为 n ， r 2 ， …， r „， 相应的均值记为 己 ，6，…，己， 

方差记为 X ， W ， …，并以化记 r , 与 o 的相关系数.一个相 
当自然的假定是：投资者都追求高收益而规避风险，也即希望有 
高的均值而不愿有大的方差.但是证券市场的历史记彔表明，对 
于个别征券而言，高收益总是伴随着高风险.根本的出路在于采 
用证券组合，即把全部资金分散投资于各种证券.假定投资于上 
述 n 种证券的资金比例分别为 Wl , m 2 , …，则总的收益率‘为 

疒户 = S 

f ^ 1 

显然，其平均收益率为 

n 

f p = Er p ~ 2 xv { r t (4. 2, 36) 

r = 1 

而方差则为 

n n 

a ] = Dr p = U D w i w i p ij ( y i ( J 1 (4 - 2* 37) 

f=i 卜 i 

因此寻找最优证券组合的问题化为：求投资比例， W 2 , …， 

使6等于某个目标值而其4达到最小，或者4控制在一个可以 
接受的水平而使乙达到最大. 

马库威茨模型兼顾了金融市场中收益和风险两大要素，而且 
形式简便，为金融学的发展开创了新局面，他也因此获得了 1990 
年度的诺贝尔经济学奖. 

四、矩 

数学期望，方差，协方差是随机变量最常用的数字特征，它 
们都是某种矩.矩 （ moment ) 是最广泛使用的一种数字特征，在 

概率论和数理统计中占有重要地位.最常用的矩有 两种： 一种是 
原点矩， 一 种是中心矩. 

定义 4. 2. 5对正整数 I 称 

m k = E^ k (4. 2. 38) 

为 k 阶原点矩. 数学期望是一阶原点矩. 
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定义 4.2.6 对正整数々，称 

c* = E($ — E$) k (4. 2. 39) 

为 A 阶中心矩. 方差是2阶中心矩. 

由于 

k 

c k = E (^- E$) k =2( ^ (—£$广 

i=0 \ 2 j 

(4.2.40) 

1 = 0 \ I I 

故中心矩可通过原点矩来表达，反之， 

m k - £$* = £[( e - m 1 )+ m J ]* 

1 k 

E($ — f ^ c k -iTn\ (4*2.41) 

i — 0\l! 

因此当已知数学期望之后，原点矩也可以通过中心矩给出. 

此外对正数/>还可以定义 p 阶原点绝对矩 £ II | ★及 阶中 
心绝对矩五莰 I 、它们较少使用. 

[例 10] 设 f 为正态随机变量，其密度函数为 



/ >( x ) 


因此莰=0,故 


m k = c k = E^ k 


/2 


e 




na 


oo 


JC —— - 

⑴ v2^a 


e 


x 2 /(2a J 


Mr (4.2*42) 


显然，々为奇数时 ， Ot = 0; 々为偶 数时， 



e — &cLr 



*-1 




iV 


k— \ 

z~ e 


z 


d 之 




0 


r 


(k + i 


特别地 


<^(k — 1)(^ — 3) … 3 • 1 


(4.2-43) 


c 4 = 3^ 


(4.2.44) 
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对于多维随机变量，可以定义各种混合矩，例如 

E ($ — E$) k (rj - ErjY (4. 2. 45) 

称为 阶混合中 心矩. 协方差是二阶混合中心矩，是其中最重 
要的一种.这里我们不 一一 赘述了. 


•五、条件数学期望，最佳线性预测 


在第三章§ 2我们曾经引进; r 条件分布函数的概念，现在要 
相应地引进条件数学期望的概念，并说明它的应用. 

为方便起见，我们讨论两个随机变量^与7的场合，假定它们 
具有密度函数/>0,7)，并以 / K：y | x ) 记已知 $ = x 的条件下，7的 

条件密度函数，以/ ^ Cx ) 记$的密度函数. 

定义 4. 2. 7 在$=1的条件下， 7 的 条件数学期望 定义为 

= x ) = yp ( y \^ c)dy (4. 2. 46) 

[例 11] 若 （ e ， 服从二元正态分布，则由 （3.2.29) 知 

❿ (— ㈣ ( I 1 - 〆 ） 


这是正态分布 A 

\ 




r — 


a 2 + 

戊1 


a 】 ) 



— a \ (1 — r 2 ) ，因此 

I 


E{rj\^ = x} = a 2 + r~(jc — (4.2.47) 

值得提醒 的是： 这时条件数学期望 £： 是工的线性函数. 

条件数学期望在预测问题中起重要作用.问题这样 提出： 若 
芒，7是相依的随机变量，我们要找$与7的函数关系，设这个关 
系是: v =/ Kx )， 如果砌 2 及五1> (幻] 2 都存在，我们的目的是找 
函数 A ( x )， 使？与 MO “尽可能靠近”，这里的“靠近”需要一 
个标准，最常用的是所谓“最小二乘法”，这时要求使 

五 [7 — 办 ⑺] 2 (4. 2.48 y 
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达到最小.因为 

E\jj — — — /K 工） ] 2 />(D)d ： rd3^ 

_ Cv ■二 J — i：x_ 1 

't O I 广 oo \ 

= p[(x) Ly — h(x)yp(y\x)dy\dx 


(4*2.49) 

由 （4-2.8) 知道， 当 A (_ r ) -£ {7丨芒:=$} 时 ， ^~ h (了）]' 

J - 

• p (« yk ) dy 达到最小，从而使 （4.2.49) 达到最小.即当我们 
观察到^=1时，五 {71^=^} 是一切对7的估值中均方误差最小 
的 一个. 

今后我们将称）_=五是？关于 f 的回归. 

通常， （6 V)的联合分布函数是不知道的，或者虽然知道但 
是却不易算出五假定已知$与 7 的数学期望内，内，标 
准差 <r 2 及相关系数 r, 这时可以降低一点要求，改为求 最隹线 
性预测. 也就是说，把 A U ) 限定为 x 的线性函数 L Or) + 
bXy 求 ， M 吏 


€{u fb ) — £[7 — (a + 办彡） 


2 


( 4 . 2 . 50 ) 


达到最小. 


把 e (a ， 幻对〜 6求偏导数并令它们等于0,得到 


整理后变成 


因此解得 


2E[j) — (a + 祕 ）]= 0 
2£[(7 - (a + 於））芒]= 0 


( 4 . 2 , 51 ) 


bfh = fh 


afj. x -f bE 安 


E ^ r ) 


( 4 . 2 * 52 ) 


a 


— bft x , h 


cov (孑， 7) 


(7i 


( 4 . 2 * 53 ) 


最佳线性预测为 


L ( x ) = + r 
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我们称 （4.2.54) 为7关的线性回归.这个结果 V 
—般是不同的，但是在（匕 ？） 是二元正态分布的场合， 
由 (4.2.47) 知两者是重合的，所以在正态分布场合，最佳预测 
是线性预测，这是一个十分重要的结果. 

进一步，我们还可以计算最佳线性预测的均方误差. 

五 [7 一 L(f)] 2 = E\jj — — 内 ）] 2 ' 

- a| -f b z a\ - Zbcowi^rj) 

= = (4.2.55) 

因此预测误差同 7 的方差有关，也同$与7的相关系数有关，特别 
当 IH =1时（这时€与7有线性关系），预测误差为0,也就是说， 
可以完全准确地进行线性预测.从这个讨论再次看出，相关系数 
反映了 专与 V 线性联系的程度. 

最佳线性预测理论中的另一个重要事 实是： 预测值(芒) 
与残差是不相关的.证明 如下： 

由 （4. 2, 54) 知 


V — 人（ I )二 A — r M ) (4. 2. 56) 

因此 

EV - M2 (4.2.57) 

£(7 — 7)—0 (4* 2 - 58) 

这样一来 

cov (7，々— 7 ) = £[(7 — "2)(7 — 1 K 


:= E r —($ — "])[(7 — / O — ^ — /jt { )j 1 

°\ a \ ) 

= r a -^{ ra x a z - - — ^) = 0 (4.2. 59) 

戊 1 

这个事实可以解 释为： 残差中已不再包含对预测7有用的知识.因 
此观察值7被分解为两个不相关的随机变量 之和： 

<V (4.2.60 ) 
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中 . ， h: Hn • 
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若以五记随机变量$的如下 函数： 当$=1时，它取值 

E 这样定义的£ W ) 是随机变量，对它可以求数学 

期望，并有下列关 系式： 

Kr) = £[£{ 716 }] ( 4 . 2 . 61 ) 

这是条件数学期望的一个极端重要的性质，有广泛应用，在离散 
型及连续型随机变量的场合，读者不难对它加以 证明. 

1 3.熵与信息 ® 


— —、 


不肯定性与熵 


随机试验的主要特征是在试验之前无法肯定地知道哪一个结 
果将会出现，即随机试验具有一种不肯定性.但是对于不同的随 
机试验，这神不肯定性的程度却可以肴很大的差别.譬如，以射 
击为例，若有两个射手，他们的射击情况分别以下列两个随机试 
验来描述： 


甲 


^ 0 . 5 , 



^ ： ^0.99, O.oJ 


这里4表示射中目标， Z 表示未射中目标，下一行是相应的概率. 
显然这两个试验的不肯定性程度很不相同，甲的不肯定性要大得 

多.假如还有第三个射手， 用来描 述其射击水平的随机试验为 

(A , A > 

丙： 

7,0, 3〉 


显然应认为此试验的不肯定性程度介于上述两者之间. 

因此有必要从数值上估计各种各样随机试验的不肯定性程 
度，即我们希望找到一个量，用它可以合理地作为不肯定性程度 
的度量.这样的一个量已经被美国数学家申农 ( Shannon ) 找到. 
假定我们研究的随机试验〃只有有限个不相容的结果木， 


①此节内容与本书其余部分基本上独立，初学时可跳过. 
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…，它们相应的概率为户 (4) ，户(阜），…， 〆 A ) ,满 
足 2>( A ) = 1，简写 如下： 

I ― 1 

» -^2 » "** ♦ 
a ： 

我们希望找到-个量// («) 来度量 a 的不肯定性 程度. 这个 
量当然依赖 F ，( A ) ， M 4) ， p(AJ ,因此亦记为 
HipiA ^ , p ( A 2 ) y ■*• , 

为了具体定出 H ( a ) 的表达式，我们先考察一下，究竟 HW 
应满足什么要求. 

首先，我们要求 

( i ) H 是 〆 A ) 的连续函数. 

这个要求相当自然，一方面/ >( A ) 的微小变化当然不应引起 
H 的巨大变化，同时也只有连续函数才便于数学上处理. 

其次，我们考虑一种特殊的随机试验，这种试验有 n 个结果， 

且各个结果出现的概率均为 j ，以后简称为有/»个等概结果的试 

r v 

验.在这种特殊试验中， H 当然应该只是《的函数，并且当《增 
大时，也即试验有更多可能的结果时，其相应的不肯定性程度也 
随之增加. 

因此，我们对 H 提出 要求： 

( ii ) 对有《个等概结果的试验，//是《的单调上升函数. 

对 HO ) 的第三个要求比较复杂，它牵涉到把一个试验分为 
相继的两个试验.我们通过简单的例子来阐述其含义. 

考虑有三个结杲的试验 

■^1 5 -^2 » -^3 

a ： 

P 2, p 3 , 

这个试验的不肯定性程度 H («) 二//(九☆，/> 3 ).为了确定到底 
是哪一个结果出现，我们也可以进行这样相继的两个 试验： 在第 
一个试验中，先确定到底是 A 出现，还是 或次 出现，即进行 
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下列 试验: 


卜4 〗， B 

以1: 

、户1，户2+户、 


显然//(%)=// (/ ^，〜+九）.如 果為 出现（其概率为九），则试 
验结果已完全确定，无须再作进一步的 试验； 但是如果是5出现 
(其概率为仏+九），则尚须进行如下试验，才能最后确定试验结 
果： 


七 ： 户2 />3 

、户 2 十户 / Pl^P'S j 

这个试验的不肯定性程度为 //( A ) . 

户2十户3户2十户3/ 

可以直接进行试验《，以确定 A 2 ，烏 中哪一个结果 出现; 
但是若先进行试验％，然后有必要时（概率 Pz + p ,) 再进行《 2 ,也 
可达到同样的目的.因此，我们自然认为这两组试验所含的不肯 
定性程度是一样的，即 


I fy ^ 

H (/>1 ypZ*pi)=H ( 夕 1 ， /> 2 + 户 3 ) + ( 户 2 + 户 3 )// p +P- * ~p~\^p I 

这些考虑启发我们对//提出下列 要求： 

( iii ) 一个试验分成相继的两个试验时，未分之前的//是既分 
之后的//的加权和. 

条件 （ i )、（ ii )、（ iii ) 已完全确定 H 的 形式. 为书写方便起 
见，下面简记夕 ( A ) 为 A . 

定理 4. 3.1 (申 农） 唯一满足 （ i )、( ii ), ( iii ) 三个条件的 
//具有下列 形式： 

n 

H = — C 2 p^ogpi (4. 3, 1) 

其中 c 是正常数. 

为证明这个定理，要用到下述分析引理. 

引理 4. 3. 1若 /( n ) 是〃的单调上升函数，且对一切正整数 
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m ， n 成立 


f (mn) = f{m) + fin) 


(4. 3, 2) 


则 


fin) — Clogn 


其中 C 是一个正常数. 

[证明]由 a 3.2) 可得/( I ) = o ，所以对其他正整数州， 
有 f(m) > 0 , 另一方面， _ 


f(n z ) = fin) + fin) — 2 fin) 
f(n 3 ) = f(n z ) + fin) — 3/(n) 


般地 


f(n k ) = kf(n) 


(4. 3. 3) 


若 n ， m 是两个任意的正整数， m 关1，选任意大的正整数々， 


再取正整数/，使 


m 


1 <n k 〈 m /+1 


(4.3.4) 


由函数的单调性 


/^)</(^) </(m /+1 


由 （4. 3. 3) 得 


lf(m)^kf(n) < (/ + l)/(m) 


因此 


J_ ^ f 00 / + 1 

k 〜 /(m) k 


对 （4. 3. 4) 取对数得 


t 


l\ogm ^ kiogn <C (/ + 1 )log^7 


因此也有 


丄 < f 

k 〜 logm k 


这样一来 


fin) logn . 1 
f (m) logm k 


上式对任意大的々都成立，因此 
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由于 


m 


的任意性即知 


f ( n ) 

log/2 

f ( m ) 

\ogm 

fin )= 

= Clog /2 


其中 C 是常数，再由 /( n ) 是 > 2 的上升函数，可知 C 是正的 • 
现在可以来证明定理了. 


[证明]首先，记 H 丄， 丄 ，…，" L =/(”）， 按条件 

^ n n n I 

( ii ) 知 /( n ) 是72的单调上升 函数. 对有 // m 个等概结果的试验，可 
以把它分解为 m 个有〃个等概结果的试验，因此由条件 （ m ) 知 


f { mn ) = /( m ) + m * — fin ) = f ( m ) + fin ) 

m 


利用引理 4. 3.1 立刻得到 


H 



Clogn 


其次， 


当户 1 ，户 


…， 九 是有理数时，不妨记/>,= 



考 


虑一个有个等概结果的试验，而这个试验又可以看作两个相 

*=1 

继的试验，其中第一个试验以概率 A 出现结果 A ;而第二个试验， 
则是在出现结果 A 的基础上，考察它是 出现〜 个等概结果中的 
哪一个，因此按条件 （ iii ) 应有 

n n 

Clog 2 n i = H 、 p ” p z ，…， p n 、 + C 2 p t logn t 

/=] i=i 

于是 


… ， p n ) = c log 


n 






n 

= ~ c ^2 A log 户, • 


™ 1 
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最后，对任意的实数九，…， A », 可用有理数来逼近它， 
但按条件 （ i ) 知 H 是各自变量的连续函数，因此上述表达式仍然 
成立，从而完成了定理证明. 

定理中的系数 C ， 可以根据方便选择，它取决于度量单位.常 
用的度量单位有二进制单位及十进制单位，前者对数的底取为2, 
后者用常用对数. 

在 U . 3.1) 中，若 A = 0, 则相应的项 AlogA 定义为零，因 
此在试验中增减零概率结果不影响不肯定性，这是很自然的. 

以后将称 

n 

=— 2 piA^logpiA,) ( 4 * 3 . 5 ) 

i— 1 

为试验 a 的嫌 (entropy). 

从下面例子可以看出，熵确实可以度量试验的不肯定性程度. 
[例 1] 计算本节开始时射击例子中射手甲，乙，丙射击试 

验相应的熵. 

1 
2 

//乙=— 0. 99 lg 0. 99-0. OllgO . 01 = 0. 0243 
//丙= —0. 7 lg 0. 7-0. 3 lg 0. 3=0. 2653 

这里均用十进制单位.甲的熵最大，乙最小，丙介于其中，与直 
观完全符合. 

[例 2] 英文字母出现的熵. 

熵的概念的 引入与 通信理论的发展密切相关，后者需要解决 
最有效而无错误地传递消息这一任务.用文字给出的消息通常经 
过编码变成某种信号，经信道传输，到达接收地点，再经译码还 
原.当然编码的优劣将直接影响通信的效率.最简单的办法是把 
每一个字母都转换成相同长度的码子，但正如本书一开头就看到 
的那样，在英文中不同字母出现的频率很不相同.因此更有效的 
办法当然是把最常出现的字母编成较短的码子，而把不常出现的 


ylg — = lg 2 = 0. 3010 


只甲 =— Y lg 
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字母编成较长的码子.这个问题与英文字母出现的熵有直接关系. 
假如把26个字母连同分隔用的空格共27个符号，看作是等 

可能出现的，则相应的试验（接收到一个符号，要判断它是哪个 
字母或空格）的熵为 

H 0 = lg27 = 1* 4314 


但是接收到一个符号，它是空格的可能性比是 z 的可能性要大 
200倍，也即不肯定性程度似乎不应该有这么大.事实上，如果我 


们考虑到不同字母及空格的出现概率（数值见第一章§1)，则 


•U -T 

=— 


. 213 


也就是说不肯定性要小 不少. 当然如果再注意到英文中前后字母 


间的联系，例如^总是接 着〃， 则这种不肯定性还要小得多. 

二、熵的基本性质 


下面讨论用 （4. 3. 5) 定义的熵的若千基本性质，通过这些研 
究将进一步看到熵作为不肯定性程度度量的合理性. 

首先考察一下函数 fix ) — xlog ^ 的性质，显然对于 x >0, 
均有 # Cr )<0， 因此 fU ) 是 （0, c «) h 的上凸函数，即对于 
任意的/>>0, q >0, 且 / >+g = l ， 不等式 

M ^ t ) + g<pM < < P ( P ^ + qx z ) (4. 3. 6) 

对一切 OOiCj ^ Coo 成立. 

一 般地，不难用归纳法证明如下分析引理. 

引理 4 .3.2 ( Jensen 不等式） 设 pU ) 是0， 6] 上的上凸 
函数，而 a ，,…，心是 [ a ， 6] 中的任意点， A ls A 2 ， …， A „ 
是和为1的正数，则 

n n 

< ?( (4. 3. 7) 

i= 1 { 

等号成立当且仅当诸 A 相等. 

下面证明熵的若干性质. 
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1. 当且仅当户 ( A ) ，/=1，2, …， n 之中的一个等于1时，熵 

H = 0, 其他情况下，熵恒为正. 

2. 在有〃个可能结果的试验中，等概试验具有最大熵，其值 


为 log”. 

[ 证明 ] 在引理 4. 3. 2 中取 <p{x) = — xlogx , = p(A t ) ， 

义 ,= 丄，代入 （ 4. 3,7) 式，得到 

n 


- 1 


n 


Y^p(A,)\ogp(A) < -^log - 


即 


H(p{A x ) ,pCA n )) ^ logn = H 


n 


n 


下面考虑两个试验 a 及/?，设它们的结果及概率如下 


浅， 


■ ■ » 


A 


\ 


户 （ Zi) ， … ， p(A m ) 


f 


氓， 


B 


n 


1/>( 尽）， … ， p(B n ) 


j 


又以 # 记这两个试验联合起来所构成的新试验，于是试验的 
可能结果为6 = 1，2，…， m , / = 1，2,…， n ， 相应的概 
率为户 （ A ^)_ 按定义 


H(a(3) 次汉） （ 4*3*8) 

kj 

3* 若试验 〃 与试验 /? 独立，则 

H(a/3) = H(a) + H(/?) (4. 3. 9) 


[证明]在这种场合 p ( A k B £ ) = p ( A k ) p ( Bi ) ,因此 
H ( a /3) =- ^ piA ^ pCB ^ logpdA ^ piB ,) 

kj 

= — ^ p ( A k ) p { Bi )[\ ogp ( A k ) + log ^ CB /)] 

kj 

=H(a) + //(/?) 

三、条件熵与倌息量 

为了进一步研究熵的性质，需要引进条件熵的概念.设《，^ 
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是前述两个试验，以记试验 a 出现结果儿的条件下，试 
验/?出现结果汉的概率，则 


H Ak (/ 3 ) ^ piB ^ A . nogpiB ^ A ,) (4,3.10) 

/ 二 ] 

是在试验《出现 / U 的条件下，试验的熵. 

我们称平均值 

m 

H 0 (/ 3 ) = ^ p { A k ) H Ai ( l 3 ) (4-3.11) 

k=\ 

为在试验 《 实现的条件下试验的条件熵. 

下面指出(/3)的某些重要性质. 

性质 1 H ( aj 3 ) = H ( a ) + H fl (卢) • （4. 3. 12) 


[ 证明 ] 


H{a^) — — ^ piAkB^XogpiAkBi) 

kj 


^2p(A k )p(B £ \A k )l\ogp(A k ) + \ogpiB l \A k )~] 

k,l 


= — y]p(A k )\ogp(A k ) ^ p{Bj\A k ) 

k t 

- (別九 )lo g〆 私 I 儿) 

k i 

- H ( a ) + H a {^) 


持别当 《 与/?独立时， H a (W = H (^), 此时 （4.3. 12) 化为 
(4. 3.9) 式. 

同理， 

H ( a ^) = 尽）+ 

这个性质 称为熵的加法法则. 推导熵的表达式时的条件 ( iii ) ， 
事实上是加法法则的另一种表述. 

性质 2从(仍是非负的.又若所有的/ >(4) >0 ， 贝! J 当且 
仅当 H a X ^) = 0( / — 1， …， m ) 时，//«(/3) = 0才成立，此时还有 
H(a 戸 ） = H{ot). 

这些性质用条件熵的定义立即得到.后一结论说明，只有当 
试验《的任何结果都使试验/?的不肯定性完全消除时，才有 
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H 0 (/?) = 0 ，此时 《 的结果完全决定了#的结果. 

3. (4-3. 13) 

[证明]在引理 4. 3. 2中，取外工 ） =—Jrlogx , A , = p ( A ,) , 
Xi = 则 

m 

- ^ p ( A t ) p ( B k \ A t )\ ogp ( B k \ A ) 

\ 

m m 

<- 在) 〆 氏 A ): 

i=l 

— — P(B k )U)gp(B k ) 

两边对 々求 和即得 

m n n 

~ 2>(A)2 >( 私 I 八 ) b 奸 ( 私 IA)<— J^p(B k )\ogp(B k ) 

i — 1 k — 1 A * 1 

此即 

HSP) < Hip) 

此外，显然有 

H(aj3) = H(a) + //„(/?) < H(a) + 

关系式 （4. 3. 13) 的涵义不难理解，因为进行试验《之后 ，一 
般对试验的结果会增加了解，从而消除了部分不肯定性，只有 
当《与芦独立时， H a {^) = H ^) ,此时《的结果无助于减少卢的 
不肯定性.因此量 H (/?) —是作了辅助试验《之后试验沒 
不肯定性的减少量，即是由于试验《的进行而得到的有关试验卢 
的信息. 

记 

I{a^) = — H a (/?> (4. 3. 14) 

并称之为含在试验《中的有关试验沒的信息置. 

因为 , 

H ( a ^) = H ⑷ + H 廟= HiP ) -h 

所以 

H ( o ) - H $ W = 聯）一 H a ^) 
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即 

1( 尽， a 、 二 /(a，/?) 

因此中含有《的信息量与《中含有#的信息量相等. 

显然 

0 < UaK H ( a )，（) < I ( a ^) < //(/?) (4. 3. 15) 

当且仅当《与/?独立时，才有 /( a , y 9) = 0，此时一个试验不含有 
另一个试验的任何信息量.另一个极端情形是当《的结果完全决 
定卢的结果，此时= 0，从而 /(«, a ) =mp • 特别地, 
/(/?，/?) = H (/3) ，这就是说，包含在试验中有关试验/?的信息 
量等于/?的熵，因而熵也是信息量. 

四、连续型分布的熵 

对于具有密度函数的连续型分布，可以类似地定义它的熵.设 
随机变量《及 P 的密度函数分别为 〆 /)及 9(30 ，它们的联合密 
度函数为 / Cr ，3/) • —种比较显然的定义熵的办法是仿照离散型 
场合，定义 

H ( a ) =— p ( x ) logp ( x)dx (4. 3, 16) 

‘ 一 oo 

H ( a ^) = — f ( jc , y )\ ogf ( x , y^dxdy (4.3.17) 

J 。 

.和 

= — /(: r ， y)log i-^—dxdy (4. 3. 18) 
J J pyoc ) 

H ^( a ) f ( x , y)\og ^——-dxdy (4. 3. 19) 

Jj Qyy ) 

这样定义的熵及条件熵具有许多离散型分布的熵的性质.简单罗 
列 如下： 

性质 1若《限制在 V 中变化，则 F 中的均匀分布有最大熵， 
其值等于 log | F |， 此处 | K | 是 V 的测度. 
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而且 

因而 

这两个等号成立的充要条件是《与/?独立. 

第一个性质说明，从熵的观点看，均匀分布具有特殊地位.令 
人惊奇的是，常见的另外两个分布——正态分布与指数分布，从 
熵的观点看，也具有特殊地位. 

性质 3设/ > Cr ) 是一元密度函数，其标准差为 < r ， 则当 
为正态分布时其熵最大，其值等于 log (对数以 e 为底). 

[证明]不失一般性，设其数学期望为零，这时要求/> (1) 
满足约束条件 

rt 

p{x)dx = 1 

及 

a 2 = x 2 p(x)dx 

又使 

H (x) = — p(x)\og p(jc)dx 

w 

达到最大.根据变分法，这相当于要求 

f [— p(jo)log p(x) + Ap(x) + /4T 2 />(j：)]cLr 


达到极大，即 


—1 —log / >( x ) +A + /4. 


0 


选取常数使其满足约束条件，即得 


pix) 


x 2 /(2* r 2 ) 


\/2na 


此时 


H(x) 




2 




/(2〆 ） 


[log /2 加 + ^~Jd 
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log v^Tra-h-r-^log VzKecr 


在 n 元场合，假定分布的协方差矩阵固定为 = ( 心），贝 lj 


pix) = — - - - fexp ( — ^rxB l x I ， jcGR" 

( 2 nr / z ( detB)J 丨 2 I 

达到最大摘 log ( 2 ire ) M / 2 ( detS ) T . 

性质 4 若密度函数 〆 ： r ) 当: r < 0 时等于 0 ,并且其均值为 
< 2 ,则指数分布 


p(x ) = 



达到最大熵，其值为 log ea . 

证明方法与推导正态分布时完全一样，不再写出. 


连续熵的性质也有与离散熵不同的，特别是它的数值会因坐 
标系的改变而改变,因此还存在着别种关于连续熵的定义，不过这 


里不准备再深入讨论了， 


熵是一门新兴学科——信息论中的基本概念.它的引入使得 
人们能对随机现象的不肯定性进行度量，是具有重大意义的. 


3 4.母函数 




整值随机变置与母函数的定义 


在离散型随机变量中，那些只取非负整数值0,1,2,…的占有 
重要的地位.事实上，我们所遇到的离散型分布如二项分布，超几 
何分布，泊松分布，几何分布，巴斯卡分布，负二项分布等都是取非 
负整数值的. 

我们称取非负整数值的随机变量为 轚值随机变置 .对于整值 
随机变量,有一种处理方法很便于应用，这就是母函数法. 


若随机变量$取非负整数值，且相应的分布列为 

0 1 2 … 

Po Pi p2 … 


( 4 . 4 . 1 ) 
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则 


'i 〉 

P ( s )= 2 P^ k (4_4.2) 

k ~ 0 

称为 $ 的母函数 （generating function ) ，艮 |3 

P ( s ) = Es $ (4_ 4. 3) 

因为母函数*由分布列完全决定，因此亦称它为该概率分布的 
母函数.由于 


2^ = 1 (4, 4, 4) 

k = 0 

由幂级数的收敛性知道 PG ) 至少在 ui<i —致收敛且绝对收敛. 
因此母函数对任何整值随机变量都存在. 

对于任一数列也可定义为其母函数，但我们以 

« — 0 

后只讨论概率分布对应的母函数. 

母函数在19世纪初被拉普拉斯引进，它是在概率论中第一个 
被系统地应用的变换法，对后来在概率论中引进其他更有用的变 
换——如下节要介绍的特征函数有启发作用.本书把变换法 
的重点放在特征函数法上，至于为什么要单独介绍母函数，首先 
是由于它比较简单，在整值随机变量场合很有用，可以作为特征 
函数的前导；其次，在随机过程中要用到有关结果；最后还由于 
从母函数法发展起来的 Z 变换法已成为解决许多问题的重要工 
具.但是，跳过本节母函数的 内容， 并不太影响本书以后章节的 
学习. 

下面求几种分布的母函数. 

[例 1] 二项分布 

P ( s )^ y \ [ n L ) p k q n ^ s k =( q -{- p 5 r (4.4.5) 

[例 2] 超几何分布 
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n 


p(s)=y] 


M\ 

1 N — M' 

\ k j 

\ n—k ) 


i N 、 


s 


(4*4, 6) 


这是起几何级数，是一种特殊函数，处理起来不大方便，在 
概率论中也很少用，由于超几何分布的名称来自于它，因此我们 
顺便提及. 


[例 3] 泊松分布 


尸⑴ 旧 




A 


I I 

S 


A 




A(j- 1) 


(4*4, 7) 


0 


番 


[例 4] 几何分布 


^ 1 P S 


( 4 . 4 . 8 ) 


二、母函数的性质 


1. 唯一性.由分布列 （4.4.1) 用 （4.4.2) 定义母函数，这 
显然是的；下面证明，由母函数也能唯一确定分布列. 

设概率分布{%}及分别具有母函数 P ⑴及 0 U )， 且尸⑴ 
= QG )， 因为尸 U ) 及 QG ) 都是幂级数，且当 M <1 时收敛，对 P 
⑴及 QG ) 求导（次，并令 .s = 0, 则得 

kl p t ^P <k \0)=Q (k \0)=kl q k 

因此々 = 0，1，2，…即两个概率分布一样. 

这样一来，概率分布与母函数是 一一 对应的，因而对于概率 
分布的许多研究可以化为对所对应的母函数的研究，因为母函数 
是幂级数，具有许多良好的性质，便于处理，所以母函数是研究 
整值随机变量的有效工具. 

2. 母函数与数字特征.母函数的应用之一是利用它能求得概 
率分布的数字特征，若 

Pis)^ 2 pkS k 

k = 0 
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p ! ( s )= s >^ J kp k s k " ] jP rf ( s ) — y ^ jkjk — DpkS ^ 2 

k - l k = 2 

这两个级数至少在 i . h < i 是收敛的. 

LX3 

当数学期望存在时， 

k - 1 

oo 

P f (1)= ^jkp k = E^ (4* 4. 9) 

_ ■一 【——^ - _ - 

k - i 

当数学期望 2 = 00 时 ， li m F ( 5 )^ 00 , 

卜 1 

同样，当方差存在时， 

oo 

£[6( 卜1)]= 2々(是 一 1)夕*=户"⑴ 

k = z 

故 

De^E^~^Eey=p tt ci)+p f (d-[p , ( 1)] 2 (4.4. 10 ) 

公式 (4. 4. 9) 及 (174. 10) Sf 算数学期望及方差的简 公式. 

[例 5] 二项分布:母函数为尸 G ) = ( g +/^)". 

E^ = P r i\) =n{q- i rpsY~^p \ s =i=np 
P” (^1) = n(n — l) (q-\-ps) n ~ 2 p 2 \ s=l = nin — l)p z 

D^ = n z p z 一 np z ^rnp 一 n 2 p 2 = npq 

这些结果在 § 1 与 § 2 中曾直接计算过. 

[例 6] 泊松分 布:母 函数为 PG )= e A(i _ n . 

E^=P' (l)=e A<r 一 u • /l| J=l = A 
p"(l)= e m • A 2 |, = 1 =A 2 

= A 2 +A _ A 2 — A 

这些结果在 § 1 与 § 2 中直接计算过，这里的计算较方便. 

三、独立随机变童和的母函数 

若随机变量$与？相互独立，它们都是整值随机变量，概率分 
布分别为及 { M ， 而相应的母函数为 4(0 及5(5)，下面计算 
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随机变量的概率分布.显然（也是整值随机变量，若记 

贝 IJ 

c r = a {) br-\-a^h r ^ l J r-^ J ra r bo 

这就是离散權积公式 （3.3.5). 

记 


as) = y^c r / 

r = 0 

利用母函数在 Ul < i 的一致收敛性及绝对收敛性， 


因此 


A(s)B(s ) = 


2^ • 

! = 0 


2^ 

/ — 0 


oo 


S ( 


k 





C(s)=Ais)B(s) 

即两个独立随机变量之和的母函数是这两个随机变量的母函数的 
乘积.这是一个相当重要的性质，由于母函数具有这个性质，因 
此在研究独立随机变量和的问题时，母函数很适用. 

容易把上面结果推广到《个独立整值随机变量之和的场合， 
若随机变量 I ，…，夂相互独立，它们的母函数分别为巧00, 
_ P 2 G ) ，… ， P „0) ，则7=^1 +^■^••+6 的母函数为 

尸 G ) =7^0) 尸 2 Cs ) …尸 „ G ) (4.4.11) 

特别当 f 有相同概率分布的场合，这时 

P(5) = [P 1 (5)] n (4.4. 12) 

[例 7] 二项分布的母 函数： 在成功概率为/>的《次伯努利 
试验中，若令 

. = |lt 在第/次试验中4出现 
，_ 10,在第/次试验中 A 不出现 

则 L •“， 乞相互独立，而且产（+6 + … 服从二项分 

布. e , 的母函数为 (9+ 扣），由（4.4.12)，7的母函数为 

P(s)=^(q-hps) n 
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这与例 1 直接计算的结果相同. 

[例 8] 掷5颗骰子，求所得总和为15的概率 
[解]若以6记第/颗掷出的数字，则总和7=6+6 +…+ 
e 5 , 6的母函数为 


PAs) 






(5 + 5 2 +/+/+/+〆 ） 


显然 I ， …， 匕是相互独立的，因此？的母函数为 


PCs) 




G +/+ …+5 6 ) 5 


所求的概率/"彳7=〗5}是尸 G ) 展开式中少项的系数 • 由于 


= & (出 H - hs 5 ) 5 r 1 卜 5 


6 


1 —s I 


s 


(1-5 6 ) 5 (1-5> 


一 5 


S 


Cl —5/ + 10/H -5 30 ) 


參 


S 

* = 0 


f — 5 ) 

k \ 


sY 


S 


( 1 —5^ 6 + …） 


故 


oo 


S (― n 


k Q 


5+走一1、 


( — 1 )*5 


S 


(1—5/ + …) 2 


是+4 


5^ 


— 0 


^{7=15} 




IX 


14 

I 10 ； 


■ 


5 X 


4」 


651 


掷骰子问题在概率论发展的早期一直占有显著地位，这里用 
母函数法给予统一处理. 

四、随机个随机变置之和的母函數 

若…， I ，…是一串相互独立具有相同概率分布的整 
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值随机变量，尸 { f 其母函数为 

oo 

f(s) = y A jfjs j 

随机变量〃是取正整数值的!且其母函数为 


: X> 


go )= y ^ jg n s n 

n ~ 1 

若 {1} 与 y 独立，考虑和7=匕+匕+…+匕，记 


P { V ~^ ^ = h t 


我们来求7的母函数 


His )= Yi h i 

i = 0 

利用全概率公式及{匕}与 V 的独立性 

LX 5 

h t —P{^j = i}= X 尸 { }P{yj — i I v=n) 


C,XJ 


»{>=4尸{$1 + 乞十… + 乞 


} 


二： ^丨尸{匕+芒 2 f …+乞^^’} 

n ^ \ 

由于6+6+…+乞为《个相互独立相同分布的随机变量之 
和，故其母函数 


^ P{^l + ^-+^ = ^ }^= [ F (5)]” 

i — 0 

因此 

cm .-> '•、••} o . 

H(s)= {u—n} + … 十匕 ==?•}/ 

r = 0 /i 二 1 / = 0 

: X] 

= 2^[^ Cs)T = G [ FG )] (4. 4. 13) 

rt = 1 

从 (4.4.13) 可以看到，随机个相互独立相同分布的随机变量之 
和的母函数是原来两个母函数的复合. 

由于 


« 
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H f (V) W [F(.v)] • F f CO 



因此当及五〃存在时，在上式中令 s = l ， 得到 

Et }= Ev • E^i (4.4.14) 

这个公式很直观，也有不少用处. 

[复合泊松分布]在上述讨论中，若 y 服从参数为 A 的泊松 
分布，则 

Gis) =e 吣一 ” 

因此7=1 + 6 +…+乞的母函数为 

H(s) =e A</ ' (I) "' 1) (4.4.15) 

以 （4. 4.15) 为母函 数的概率分布 称为复合泊松分布. 这种分布也 
很有用. 

特别当 F ⑴ + 涔时， 

H(5)==e A/,<J - 1) 

[例 9] 若每条蚕的产卵数服从泊松分布，参数为 A , 而每个 
卵变为成虫的概率为/>，且各卵是否变为成虫彼此间没有关系，求 
每条蚕养活 々只 小蚕的概率。 

[解]这是第二章习题.现在利用上面结果立刻知道小蚕数 
服从参数为的泊松分布，因此所求概率等于 

k\ 

b 

[例 10] 观察资料表明，天空中星体数服从泊松分布，其参 
数为 AV ， 这里 V 是被观察区域的体积.若每个星球上有生命存在 
的概率为/>，则在体积为 V 的宇宙空间中有生命存在的星球数服 
从参数为心^的泊松分布. 

[保险中的索赔模型]在非寿命保险中通常采用如下索赔模 
型： 

7 = 6 + 彡 2 +…+6 ( 4 . 4 . 16 ) 

这里 I i = \, 2,…为独立同分布随机变量，表示第/次索赔数 
额，而总索赔次数则是随机变量#，因此表现为随机个独立随机变 
量之和的形式。更一般的索赔模型则还假定#也是随机个随机变 
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量之和 


" = 夕1+汐2 +…+久 (4^ 4* 17) 

例如一次事故引起随机个索赔，而事故次数也是随机的.在这类 
模型中通常假定事故发生服从泊松分布. 


§5. 特征函数 


一、 定义 

数字特征只反映了概率分布的某些侧面，一般并不能通过它 
们来完全确定分布函数，本节将要引进的特征函数，既能完全决 
定分布函数而又具有良好的分析性质. 

为了定义特征函数,我们需要稍为拓广一下随机变量的概念， 
引进复随机变量. 

定义 4. 5.1 如果芒与？都是概率空间 （ fl ， 上的实 
值随机变量，则称为 复随机变置. 

从定义知道，对复随机变量的研究本质上是对二维随机向量 
的 研究. 这里举一个 例子： 如果二维向量（ I ，％)与 （6, %)是 
独立的，则我们称复随机变量+ 咏与 6 = 6+%是独立 
的. 

定义一个复随机变量 ^ e - hiv 的数学期望为 

E 卜 

对复随机变量也可以平行于实随机变量建立起一系列结果. 
例如，若 I , ? 2 ，…， L 是相互独立的，则 

又如，若 ( x ) 是一个一元博雷尔可脷函数，而 7 =g (0, 
则 

Ee u，! = Ee ' tg ^ = T e _ dF f Cr ) (4.5.1) 

J — oo 

这里常用欧拉公式 e — = cosr 7+ isin 巧. 
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以后将随时引用这类结果而不再加以说明. 

下面引进随机变量 f 的特征函数. 

定义 4. S .2 若随机变量 S 的分布函数为& (: r )， 则称 

P O 

feiO = Ee^ = e^d^(x) (4. 5 - 2) 

」 ― oo 


为 芒的特征函数 (characteristic function ). 

特征函数是一个实变量的复值函数，由于 | eN = l ， 所以它对 
一切实数£都有意义. 

显然特征函数只与分布函数有关，因此亦称某一分布函数的 


特征函数. 

对于离散型随机变量，若其分布列为 

f x x x 2 * m * 工 《 … 

、 P\ Pi … Pn* 0 \ 

则其特征函数为 . 


fit ) — pje ltx j (4. 5. 3) 

特别地，对 f 整值随机变量，若其母函数为尸 ( s ), 则 /(O = />( 〆 )• 
对于连续型随机变量，若其分布密度函数为/> (1)，则其特征 
函数为 

fit) = e l ^p(x)dx ( 4 . 5 . 4 ) 

^ — oo 

这时，特征函数是密度函数 /> Cr ) 的傅里叶 ( Fourier ) 变换. 

一般情况下的特征函数可以看作是这种傅里叶变换的推广. 
傅里叶分析是数学中一种非常有力的工具，它在许多数学分支中 
都起了重大作用，以后我们将会看到，它在槪率论中也占有突出 
的地位. 

下面指出一些重要分布的特征函数. 

[例 1] 退化分布 / Or — c ) 的特征函数为 

fit ) = e if, (4.5. 5) 

[例 2] 二项分布5(«， />) 的特征函数为 
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[例 3] 
[例 4] 


fit) 




(pe [t +q) n 


泊松分布 PU ) 的特征函数为 


fit) = e^ ei 


/ 1) 


r 分布 g u ， r ) 的特征函数为 


fit) 




e 


i/j ： 


A r 


r(r) 


x l e 






DO 


A r 


r(r) 


x 


l e ^ M 1 - l i )x dx 






A 


/ 


一、性质 


下面介绍特征函数的一些基本性质. 

性质1特征函数 / U ) 有如下 性质: 

/(0) = 1 
1/(0 i </( 0 ) 
/( — t) = 了 (t) 

'oo 

[证明]/(0) - J _ ： ra ldF ( x)-l 

1 /⑴ |e ,<x |dF(x) = 1 =/(0) 

J — oo 


/(— 0= 




e' Ux |dF(x) 




e ,<jr dF(x) =f(t) 


性质2特征函数在 ( — CO , co ) 上一致连续. 
[证明]因为 


j — fit) I 


广 oo 


yit + h)x 


e ^) dFU ) 


< 


ft/ 


e^-l|dFCx)<2 




i/ 


\x\^A 


dF(x) + 


rA 


e 


ihj 


A 
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( 4 ‘ 5 . 6 ) 

(4. 5. 7) 

(4. 5. 8) 

(4. 5. 9) 
(4*5. 10) 
(4.5. 11) 


— 1 |dF( ： r) 





dF {x ) + 2 


• ^ 1 7 ^ / \ 

sin -- ( jc ) 


注意上式右边已与 f 无关； 可选足够大的 4 使 


\sc\^A 


dFU) 任意 


小，然后选充分小的 |A| 可使第二个积分也任意小，从而证明了结 

论. 

性质3 对于 任意的正整数 n 及任 意实数…， t n R ^ 
数為， 立 


，匕及 


/I r* 

〉 i jj(t k ~ a , ^ 


(4. 5. 12) 


[证明] 


2 2仇 -~) A 


- tt{r 州卿)}“ 

k^\ j^\ J _°° ) 

= {2 S^ ^ X k \ } } dF ( x ) 

J 》 *= 1 ;=1 

=( S^A,)(j]e-VA ; )dF(x) 

J … k^\ j=l 

，■心 fi 

、 = |2>、 乂 2 di^(x)>0 

_ro jt= i 

这个性质称为非负龙详，以后我们将会看到，这是特征函数最本 
质的性质之一. 

性质4 两个相互独立的随机变量之和的特征函数等于它们 
的特征函数之积. 

[ 证明]设6与6是两个相互独立的随机变量，而 7 =^ + 
与2, 由&与的独立性不难推得复随机变量 e % 与也是独立 
的，因此 

£eM = £ e if < W=£ e irf i • Ee u ^ 

性质4可推广到 W 个独立随机变量之和的场合. 


* 
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应当着重指出，正是由于性质4,才使特征函数在概率论中占 
有重要地位.由于这个性质，独立随机变量和的特征函数可以方 

便地用各个特征函数相乘来求得，而独立和的分布函数要通过褶 
积这种复杂的运算才能得到，相比之下，用特征函数来处理独立 
和问题就有力得多.独立和问题在概率论的古典问题中占有“中 
心”地位，而这些问题的解决大大有赖于特征函数的引进. 

性质 S 设随机变量$有《阶矩存在，则它的特征函数可微 
分《次，且当々 时： 

/ ⑴ （0) = (4.5.13) 

[证明] 

(e iur ) - tiVe'^|<|x|* 

由于$的 々阶矩 存在，故厂|工|>0^(尤)<^，因而可作下列积分 

J — oo 

号下的微分 

/ ^(e'OdFU) 

J — OO CJ.^ 




jc k e ax dFCx) 


取 t = 0 即得 （4* 5.13). 

性质 5 使我们可以方便地求得随机变量的各阶矩. 

推论 若随机变量$有《阶矩存在，则它的特征函数可作如 
下 展开： 


/( ,)…績 + ••• +，”+ 〆 ,） 

(4. 5. 14) 


[证明]由性质5, / 0) 可以在 r = 0 近旁作泰勒展开，公 
式 (4. 5.14) 就是在带有皮阿诺余项的展开式中，代入 
(4-5.13) 式而得到的. 

性质 6设7-^+&这里心6为常数，则 
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f v (t) 




ibt 




( 4 . 5 - 15 ) 


[证明] 


Mt)=Ee ltv ^Ee lt{u ^ b) 


e 


ltb E^ ta 


ibt 


Mat) 


[例 5] 正态分布 N ( a ，/) 的特征函数 
先讨论 iV(0, 1) 的 场合： 


/ it) 


V 2 n 」 


irr e—Tdx 


v2n 


costx * e^l 


da: 




由于正态分布一阶矩存在，可对上式求导，得 


f (O 


V2n 」 


(—x ) sintre - T dx 


v 2^ 


sintrde 


― oo 


f 1 

smtx * e 2 

CO 1 

- v2^ ■ 

— OO ^ 2^ W 


tcostx • e 


Td 


co 




因此 


ln/(0 = —~+c 


由于 /(0) =1， 所以 r = 0 ， 这样一来， 

fit) = e-T 

般 W (a ，/) 的场合，利用性质 6 即得 


(4. 5. 16) 


fit) 


e 


ia / 




(4. 5. 17) 


三、逆转公式与唯一性定理 


现在来证明特征函数与分布函数是相互唯一确定的，由分布 
函数决定特征函数是显然的，剩下来的是需要证明可由特征函数 
唯一决定分布函数. 

下面定理的证明要用到如下数学分析的引理. 

引理 4. 5. 1 设 x ^ Xzj 


暑 
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g(T ,x 2 ) 


TC 






0 




sin/(x — x x ) sint(x — x 2 ) 




dt 


( 4 . 5 , 18 ) 




f 


lim g ( T , x , x ly x z ) 

7 , 一 ►oo 


0, j : < 或 x > 工 2 




x 


工 1 或 


X = x 2 




A <ix <ix z 


( 4 . 5 - 19 ) 


[证明]从数学分析中知道狄利克雷积分 


D ( a ) 


1 

71 




oo 


smat 


d / 


f 


， a > 0 


•/ 


o 


0, a = 0 


( 4 . 5 . 20 ) 



a < 0 




而 


lim g(T f x 2 ) = D(jc — X \) — D(x — 工 2 ) 

7 1 — ) 

分别考察 1 在区间 （: ^ ，: r 2 ) 的端点及内外时相应狄利克雷积分的 
值即得 （4.5.19). 

定理 4. 5. 1 (逆转公式）设分布函数 FCr ) 的特征函数为/ 
⑴，又々，的连续点，则 


F ( x 2 ) — Fix x ) = lim -- 

7^oo ^7 Z 




rr e - 


e ^ iu 2 


T 


it 




(4.5.21) 


[证明]不妨设402，记 


It 


2 兀 J 




e 


itJC. 


T 


it 


f ( t)dt 


2k 






TJ 


e~ lU i — e— tx 


oo 


it 


e ltx dF ( x)dt 


m 


为证被积函数的有界性，用到不等式 
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—11< t^l 


事实上，对 a >0 


ia 


一 1 


^dx 






n 


d 


对 a <0， 取共轭即知也成立. 
因此 


itx 


itj 


itJC 


it 


交换上述二次积分顺序得到 


< 工 2 


丁 1 


// 


2 n 


oo 


… CJO 


— it JT 

e i 


—— itT. 


-T 


u 


e l ^ d / 


dF ( jt ) 


2 穴 


CO 




if (x 


if (jr—) 


+e 


if (jr — 


0 


it 


sin/ (jt— jr i) sini (x — x 2 ) 


dt 


dF ( x ) 


t 


cU 


dF ( x ) 


/% 


g(T,x,x } ,x z )dF(x) 


mf 


— Oa 


此处 g (7\ x ， a ， i 2 ) 按 （4. 5. 18) 定义•由 （4. 5. 19) 知 
\ g ( T . x , x 2 ) I 有界，因此由勒贝格控制收敛定理①并利用 


引理的结果可得 


lim 1 

7 —► 


f^ r 


lim g(T f x^x x ^x 2 )dFCx) 


F ( x 2 )— F ( xi ) 


定理 4. 5. 2( 唯一性定理） 分布函数由其特征函数唯一决定. 
[证明]应用逆转公式，在 F ( x ) 的每一连续点上，当: y ； 沿 


F ( x ) 的连续点趋于 一 00 时，有 


F(x) 


2 丌 


lim lim 




— itx 


(4. 5. 22) 


而分布函数由其连续点上的值唯一决定. 


①为了避免冗长的分析论证，在证明特征函数的逆转公式及逆极限定理时，我 
们共四次使用了实变函数论中关于极限号与积分号交换的勒贝格控制收敛定理. 
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由唯一性定理可知特征函数也完整地描述了随机 变量- 
特别当/(0是绝对可积函数时，有下列更强的结果 • 




定理 15. 3若 


1/(0 |&< ⑺ ，则相应的分布函数 FOr ) 的 


cxu 


导数存在并连续，而且 


F f ( x ) 


2 丌 






lijT 




(4. 5.23) 


[证明]由逆转公式，若 r + Ar 及工是厂(^)的连续点，则 


阳 + Ar) ^^lim 1 


Ax 

利用 k tt - i |< kl ， 可得 


T 


2 艽 




i/x 


—Ar) 


T 


itAx 




一 itx 


—U(x+ Ar) 


itAr 




依假设 


I/O) |dz<oo, 因此 

— oo 

F — F ( jc )] 


Ar 


2 k 


作 . 


— iLr 


if(jr +Ar) 


i^Az 


f(t)dt 


利用控制收敛定理 


F ，( x ) = \im 


F ( x + Ax )- F ( x ) 


Ax 




2 兀 


itx 




lim 


ex 


itAr 




2 丌 J 


f^ r 




ex 


因此 (X) 存在而有界•再次利用控制收敛定理即得 F ' 
( x ) 的连续性. 

因此在/0)是绝对可积的条件下，分布密度/ »<>) 与特征函数 
/(0通过傅里叶变换来联系. 

四、分布函数的再生性 

许多重要的分布函数具有一个有趣的性质- 再生性.这个 

性质用特征函数来研究最为方便.下面通过几个例子来说 明它. 
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[例 6] 若芒 i 服从 B(mj p ) » 服从丑(《，/>)，而且二与 

芒2独立，贝 1 J 7=6+芒2服从 S(w + «， 户). 

事实上 /' (/) = (/^+ 9 广，4(*) = (/^+0”，由性质4知 

/▽(，) = (〆+ 分 )… 

因此由唯一性定理知7脤从 B ( m + n ， p ). 

这个事实简记作 

B ( n } , p ) * B ( n 29 p ) =/?(〜+ 打 2 ，/>) (4. 5- 24) 

[例 7] 若$服从户认） ，乞 服从尸 ( A 2 ) ，而且^与匕独立， 
则 7 = 1 十匕服从 P ( A + A 2 ) .事实上 

/”( i )= e ( 、 + V ( ’ n 

这个事实简记作 

-FU! +A 2 ) (4.5.25) 

[例 8] 若$脤从 N ( a l9 a ；), 服队 N ( a 2 , 4) ,而且 
芒1与芒2独立，则7=芒1十芒2服从 W (<2 i +<2 2 ， W + W ). 

事实上 

fe (t) =e ia i^T ff i ,2 ,/f (z) = e ia 2*—"H* 2 

1 2 

/ v (t) =e i<a i 如 V 卜 

这个事实简记作 

N(a ： ,a\) ^ N{a 2 ^\)^ z Nia l J ra 2 ^a\-\-a\) (4. 5 - 26) 

[例 9] 若 6 服从 C ( A ， n ), 6服从 G ( A ， r 2 )， 而且 6 与 
芒 2 独立，则 V ~^ i ~^^2 服从 GU , n + r 2 ). 

事实上，由 （4.5.8) 


八⑴ = 



，八⑴ = 


/ 〆 ，）= 

\ 




这个事实简记作 
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Ga^r,)^G(X,r z ) = Ga.r, + r 2 ) (4.5*27) 

还有不少重要分布也有再生性，我们把它们留给读者作为练 

习. 

还有人研究了这类命题的逆命题——分布函数的分解问题， 
即若两个独立随机变量之和服从某一分布，问是否能断定这两个 
随机变量也分别脤从这个分布.已经证明对于正态分布及泊松分 
布逆命题的确成立. 


五、多元特征函数 


若随机向量 ( U 2 ，…，己）的分布函数为，: r 2 ，…， x rt )， 与 
随机变量相仿，我们可以定义它的特征函数 


山 ， … 山 ） = 



， … , x rt ) 


(4.5.28) 

可以类似于一元的场合，建立 起 《 元特征函数的理论，由于方 
法完全相同，我们只叙述一些有关结论，证明一概从略. 

性质 1 / h 山 ，…， U 在 R " 中一致连续，而且 

|/( ， 1 “ 2 ， ". ，尤”）丨 </( 0 , 0 , •••，()）=1 

/(— ， 一 4 ， … ， 一 G) =/(，t “ 2 ， ••• ，匕） 

性质 2如果/(6山 ，…， U 是 ( U 2 ，_", t ) 的特征函数，则7 

+ 的特征函数为 

f v U) = /( 叫， “ J ， … $a n t) 

性质 3如果矩五砟冷…办存在，则 




r^i 


“2 一 +、/( q “ 2 ，" 

…一 



(4.5,29) 


性质 4若（6, …，钇）的特征函数为 /( 匕，…， 

U ， 则 A < k < n ) 维随机向量（6, …， <?*) 的特征函数为 

/ l ，2, …， 〆 山，…，心）=/(户1 ， t ” … 山，0,…， 0) 
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这是前 A 个分量的々元边际分布函数对应的特征函数.对应于任 


意々个分量 I ， I ， …， t 的边际分布函数的特征函数，可以类 


似得到. 

逆转公式 如果 /( h 心， • 
O 的特征函数，而尸(々，1 2 , 

是 =1 ， 2,… 


U 是随机向量（匕，匕， • 
xj 是它的分布函数，贝 ij 


， w } 



7 = 1 ,…， 

• / (^1 f t 2 5 ft n ) dt x dt z *^ dt n 


II 

k— 1 


e ^ 


—— e 

i^T 



其中山和&都是任意实数，但满足唯一的要求： （&, 芒 2 , 
O 落在平行体 



a k ^ ： JCk<ibk ^ 々二 1 ， 2， …， w 

的面上的概率等于零. 

唯一性定理 分布函数/•'(心 ，: r 2 ，…， ^„)由其特征函数唯一 

决定_ 


有了唯一性定理，可以进一步证明特征函数的如下两个性质， 
它们表征了独立性. 

性质 S 若 ($，…， D 的特征函数为/(6, / 2 ，…， U ， 
而 t 的特征函数为⑴，）=1，2, •"，《，则随机变量乞， I ， 
…， 乞 相互独立的充 i 条件为 

/( ， ” ， 〆••，，„)= (t n ) (4*5- 30) 


性质6若以义（（，…，〜），/ 2 (a ，…，‘） 及 f ( t ” 


_魯# 


n 


U\ 


Urn ) 分别记随机向量 （ f ， … ，乞 ），（％， …，〜）及 




，乞， 


，心）的特征函数，则^ 


• • * 


，乞）与 （7 m 


独立的充要条 件为： 对一切实数…， t n R 


U\ 9 …, W 


m 


成立 


/(~ ， … 山 ，〜， … $ u m ) 



(4.5.31) 


• 233 - 



在下一节，我们要用到如下定理，相应于此定理的一维结果， 
将在下章叙述并证明. 

连续性定理 若特征函数列{乂（^，^，…， f „)} 收敛于 一 
个连续函数/ U ， 则函数/ (^，〖 2 ,…， U 是某 

分布函数所对应的特征函数. 

6. 多元正态分布 


— 、 


密度函数与特征函数 


在本节中，我们将讨论多元正态分布的定义与性质，假定读 
者具有矩阵论的基本知识.因为对二元的场合我们已直接推导过 
其中的大部分结果，所以基础知识不足的读者不妨跳过本节. 
下面，我们将以黑体的小写字母记列向量 


f \ 



% 

* 

_ 

， 

芒 2 

* 

畢 

_ 



A , 


以黑体的大写字母记矩阵，例如 

办 11 b 12 … b ln 

B 二 


b ”' h 


« • * 


Kn) 


n 


以' 记矩阵（当然也包括向量）的转置，因此忒（其中 ， f 


为列向量）；以 B 一 1 记 B 的 逆阵； 以 detB 记 II 的行列式之值. 

在 （3. 2. 13) 中，我们已定义了《元正态分布的密度函数，采 
用列向量形式，其表达式为 


p ( x ) 


(2^) M/2 (detB)T 


exp 


— ( x — a ) 


(4. 6. 1) 
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其中 5是《 阶正定对称矩阵， I * 是实值列向量， 并简记为 N ( a ， 

事实上，我们还需要证明由 （4.6.1) 定义的函数 是兄 1 中的 
密度函数. 

显然 

p ( x )>0, x ^ K n (4.6.2) 

因此只须验证下式成立 

f% 

p ( x ) dx — 1 (4_ 6* 3) 


为了证明（4.6.3)，我们要用到矩阵论中这样一个结果：若 
J ? 是正定对称阵，则存在非奇异阵 L ， 使 



B = LL ， 

(4, 6. 4) 

作线性变换 

y — L l ( x — a ) 

(4.6 - 5) 

则逆变换为 

x — Ly+a 

(4* 6. 6) 

变换 (4. 6. 6) 的雅可比行列式由下式给出 



detL = ( det ^ S )"^ 

(4* 6. 7) 




从而证明了（4.6.3)，所以 （4. 6.1) 确实定义了 R ” 上的一个密 
度函数 • 


定理 4.6.1 w 元正态分布（4.6_1)的特征函数为 


fit ) =exp 




( 4 . 6 . 8 ) 
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[证明]按定义 


r 


fit) 


R 


n 


e ltx p(x)dx 


(2 丌广 /2 (detfl) 




e lf r exp 


(x — a) B l (x—a) \dx 


R 1 


作变换 （4.6,5), 注意到 


\tx 


— (jr—a) 


记 s = Z / f ， 则 


Ly 


y y 


it x 


(x~ ~a) f B l (x—a 


因此 


i/ c + is 


y y 


n 


2 ^kyk — ^yyl 


k=l 


n 


n 


ifl ’ 卜了 2 (%— 2 


k 


k^\ 


n 


ia f t 


/] (yk — ) 2 — ^ 


k 


fit)= 


e 1 


a f t- ~t j Bt 


(2^T n (detB) 




<jr ； 




n 


exp 


2 (yk — ^s k ) 2 (det 忍 ） 7 d 3 v"d ： v„ 


- oo 


k — 


e 


lQi~ Bt 


在 （4.6. 1) 中，假定 B 是正定对称阵，否则该表达式没有意 
义，因此我们只是对正定对称阵忍的场合定义了多元正态分布, 
但是利用特征函数表达式 （4. 6_ S ) 有可能把定义拓广到一般非负 
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定对称阵的场合. 

事实上，设《是非负定对称阵，令札=及+^/，这里/是《 
阶单位阵，显然札是正定对称阵，因此 

是/2元正态分布 WU ， 故)的特征函数.现在 

\ imf k U )^ e ia，t ¥ Bt = f { t ) 

走一 ►OO 

而 fit 碟 IV 上连续，因此由上节的连续性定理知/⑴是上某 
分布函数的特征函数. 

这样可以引进如下一般定义. 

定义 4. 6.1 若《是《维实向量，忍是 n 阶非负定对称阵，则 
称以 （4.6.8) 式中的 /(/) 为其特征函数的分布函数为《元正态 
分布，并简记为 AKflj ). 

按照这个定义，当忍为正定对称阵时，其密度函数由 

t 

(4. 6. 1) 给出； 但是当 detB = 0 时，密度函数无法写出.可以证明， 
若忍的秩为 r ( r < W ，则这时概率分布集中在一个 r 维子空间上， 
这种正态分布称为退化正态分布或奇异正态分布. 

在下面讨论中，我们总是假定随机向量 ( 匕， …， 
乞 V 服从 n 元正态分布# ( o , fl ), 

定理 4. 6* 2 f 的任一子向量（$*，&，…，乞 Y 也 

1 ^ M 

服从正态分布， 分布为 N G ， B ) ， 其中5 二 （％，'，•••， a km ) 1 , 

5为保留的第 I ，々 2 ，…， L 行及列所得的 m 阶矩阵， 

特别地，€服从一元正态分布 iV (七，心). 

[证明]只须在特征函数 （4.6.8) 中对一切不等于々,， 

* 

&，•••， L 的/，令6 = 0即得（^，…，的特征函数 

7(7) = e ia "- T* ，Bi 

这里纟= ( h 山 2 ，…这正是 #( a ， 及)的特征函数. 

定理 4. 6. 2表明，多元正态分布的边际分布还是正态分布. 
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定理 4. 6. 3 fl 及分别是随机向量 f 的数学期望及协方差 
矩阵，即 

a 产 ( 4 . 6 . 9 ) 

b } k = E{^j — a i ){^k — a k ) » ( 4 . 6 _ 10 ) 

[证明]由定理 4 . 6 . 2 立即得到 （ 4 _ 6 . 9 ) ，而且知道 D ^ j = bj , 
存在，由柯西一施瓦兹不等式又知各协方差存在，因此由 


( 4 . 5 - 29 ) 

r^t t — JL 

一 -2 


dtydtk 


bjk-\-ajak 


故 

E{^ i — a j ){^ k ~ a k ) = E ^^ k ~ a j a k = b jk 

因此元正态分布由它的前面二阶矩完全确定. 


二、独立性 


正如在二元场合一样，对〃元正态分布而言，独立性与不相 
关性有密切联系. 

定理 4. 6. 4 $,&，•••，相互独立的充要条件是它们两两 
不相关. * 

[证明]必要性显然成立，下证充分性. 

若 …， 乞两两不相关，即对一切户 


£[(( — £芒 ; ）（^ —£匕）] 



因此、=£：(€ — £()(& — £匕）= 0,所以 „ ” 

r/ 、 ■ S ^k-'z S b kh i k 2 

/( 匕， … 山 ） = e* =1 


n 


11 e * V * _ 2* fr **^ 2 


亡八 (’*) 

k= 1 


由上节多元特征函数的性质 5 可知…，乞相互独立. 
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定理 4. 6. 5 


若 


^2 


，这里己与&是？的子向量，记 



B 

B 


11 


21 


B l2 

及22 


(4. 6. 11) 


其中 B U R /? 22 分别是6 及& 的协方差矩阵，《 12 则是由6与&的 
相应分量的协方差构成的相互协方差矩阵，则&与&独立的充要 


条件是 i ?12 —0. 

[证明]若&与&独立，则&的任一分量与 f 2 的任一分量 
独立，因此其协方差为0,从而由它们构成的矩阵取 2 =0,这就证 


明了必要性. 

下 面来证 明充分性*由 b t j = bj t >因此 B 2 \ = B \2 = Hf 右 t 
这里 6 与 6 有相同维数，^与？ 2 有相同维数，则 2 


t f — 2/iBi2^2 H - ^2^22^2 = ^1^11^1 


因此若记 AE = 



，其中 A ， 《 2 分别为 6 及&的数学期望，则 


/f(0 =exp 


ia r t — ^rt f Bt 



exp I +ia 2 t 2 — — ~t 2 B 2 zt 


exp I — 1 • exp \d z t z 


^rt z H zz ti 




由上节多元特征函数的性质6可知&与&独立. 

类似地可以证明，若 f 的子向量6, &，…，&两两独立，则 
它们也相互独立. 


三、线性变换 

_ T 

服从正态分布的随机向量在线性变换下具有许多特殊的性 
质，这些性质有很大的理论和实用价值，下面只讨论这类性质中 


最基本的一些. 
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- ^ 


般， 若卜 （ e ” …， 乞)'是”维随机向量，其数学期望为 


«，协方差矩阵为凡 


n 


考虑 f 的分量的线性组合卜显然 


2 Z / 


Va 


(I 6. 12) 


D^=TiTihl k b Jk = t f Bl 


(4. 6. 13) 


同样地，若是 mXn 矩阵，则 m 维随机向量? 7= Cf 有 


Eq=Ca 

Dtj=CBC 


(4. 6. 14) 
(4 - 6. 15) 


这里记 r ? 的协方差 矩阵, 


定理 4.6.6 (1， …， O ' 服从 n 元正态分布 7 V ( fl , 及)的 


n 


充要条件是它的任何一个线性组合服从一元正态分布 


n 


n 


M Ym” s hhh ]k . 


；^i 


[证明]必 要性： 若 f 服从 W ( fl ， 5)， 则由 （4.6.8) 


Ee 




exp ia 




t f Bt \ 


取 f =^/， 这里 a 是实数，则 


£ e mf -£ e lwrf -exp m «7 


u 2 l f Bl 


(4. 6.16) 


对 ^ 是任意实数上式都成立，这就说明随机变量？服从 mr a ， 

tBl ). 

充 分性： 若^=/乂服从^<|，/'历），仍有(4.6.16)，在该式中 

乂 = 1，得 


取 


Ee 




exp ( \ a f l ~~ l f Bl 


由于 / 的任意性，这说明 f 服从 

利用定理 4. 6 J 可以通过一维正态变量来研究多维正态变 
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量.在有些场合这提供了 很大的 方便， 

定理4_ 6. 7 若 d ， …， 乞) '服从《元正态分布 W («， 
B ), 而 C 为任意 wXn 阵，则 n = 服从 w 元正态分布 iV iCa ， 


CBC f ) * 


[证 明] 因为对于任意⑺维实值 列向量 G 

fr,{0=E^^E^ m =Ee iCtn 

= exp {ifl' (C ， )- 如 Cr V » (C7) 


exp|i(Cfl ) ; /—(CBC )t 


(4. 6. 17) 


按定义， t ? 脤从 m 元正态 分布# (Cfl, CBC). 

定理 4. 6. 7 表明正态变量在线性变换下还是正态变量，这个 
性质简称为正 态变董的线性变换不变性. 

推论1若 f 服从” 元正态分布 ( a , B ), 则存在一个正交 
变换 " ,使得 V = U § 是一个具有独立正态分布分量的随机向量，它 
的数学期望为 t / fl , 而它的方差分量是 B 的特 征值. 

[证明]从矩阵论知道，对实对称矩阵存在正交阵 f /， 使 
UBU =D ， 其中 


\d, 0 

0 d 2 


0 0 




*# ■ 


0 

0 


\ 




d n 




(4. 6.18) 


这里 d 2 , …，‘是 B 的特征值.若忍的秩为 r ， 则有 r 个特 


征值不为零.此处的 C / 是以特征向量为列构成的正交阵. 

把这里的 t / 作为定理 4. 6. 7中的变换矩阵，则利用该定理的 
结果即得推论 1. 

从推论1可以看出，若 J ? 的秩 r <«, 则正态分布退化到一个 
r 维子空间上. 

推论1说明，对于多维正态变量，可以进行正交变换，使其 
既保持正态性不变又让各分量独立，这种方法在数理统计中十分 
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有用 • 


第三章 § 3 中的例 8 提供了利用坐标旋转（正交变换的一种 ) 

把二维正态变量化为独立分量的生动例子 . 

推论 2 在正交变换下，多维正态变量保持其独立、同方差性 
不变 . 

其证明留给读者作为习题。 


四、条件分布 


若 f 




服从〃元正态分布 N(« ， B) ， 这里 ft ， 6 是它的子 


向量， 二 a” E 《 2 =a 2 , 协方差矩阵仍由（ 4.6.11 〉表出 • 
下面求在给定的条件下？ 2 的分布密度函数.假定 
detBX) ， 即只讨论非奇异的场合，这时 det^n^0. 

首先，我们来找一个线性变换 

*?1 = §1 
^? 2 = 代 1+?2 

这个线性变换使 rh =6, 此外我们还要求它使得 rh 与 rj 2 独立.由 


定理 4. 6. 7 我们知道 ；] 


ri 

n 


是联合正态的，因此根据定理 4_ 6. 5 


为使 R 与 rj 2 独立，只须它们的相互协方差矩阵为零阵.但是 

-~ ET] z y 




EHE §') (i + f 2 — TE§ X — ED ， 

BuT 1 


因此应取 




_ _ n o 

一 — 02\ffn 


故 


^2 = — 及 21 办 llfl 


所求的线性变换为 
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/ X 

Hi 


I 0 





B n B n / 


.^2 , 


为求 rh 及 仏的分 布密度函数，先计算 

Et ^\ 1=1 E ^\ f JDtJi - D^iBn 
Et\i = ~BzxBix E^\E^2~^2 — B2iBn l U] 


(4.6. 19) 


Dt] 2 =E(r} 2 ~Eq 2 ){rf 2 —Eri 2 ) f 

= E \^(.^2 — <*2) —及 2 J 11 1 (fl _ fl l )] 

= B22 — B21B11 1 B \2 — B12 B21B11 1 B12 

= 沒22 — ^21® ll l ^12 

正如上述， rn 与 r ? 2 是独立的，又变换 (4. 6.19) 的雅可比行列式 
等于1，所以有 


p^x x ^x z )=p T} {yi ， y 2 ) = (yi)pn 2 (J2) 


这里 ）1=1， yz ^— BzxBi ^ x ^ Xz ^ 显然（少 i ) ，因此在 
给定6 = 4的条件下，的密度函数 


P (^2 ^1 — Jfl ) = 


p^(x l9 X 2 ) 

P ^ xS ~ 


二 /\ ( yQpn 2 ( yt ) 

~ 



因为服从 W (“2 —私〗忍，忍22 —及 II 1 及 12) ，所以&对于 f 1 = 

I 的条件分布是正态分布 N ( a 2 -\- B 2 iBn l ( a — fl t ), B 22 — 
B 2l Bn l B lz ). 我们把这个结果总结为下列定理. 


定理 4. 6. 8 


若卜 


& 

f 2 


服从 n 元正态分布 W ( a , B )， £& = 


fli ， EL = a ” B 表示成 （4. 6. 11) ，则在给定&=々下， f 2 的条件 
分布还是正态分布，其条件数学期望 

£(^2 j^i=Xi) —c 2 ^B2iBix l (* 1 — fli) (4 - 6. 20) 


其条件方差 


B 22 



]> n~ 1 n 
*>21 »U 


(4.6.21) 
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这里 £ 称为关于 f , 的 回归， 注意到它是&的线性 

涵数，又条件方差尽 2 m 与 h 无关. 

我们已对二元正态分布的场合进行过类似的讨论，这类问题 
将在数理统计中继续深入研究. 

第四章小结 

本章主要讨论了随机变量（或分布函数）的数字特征与特征 
函数，它们都是概半分布的某种表征.这些讨论不但深化了对随 
机变量的认识，同时也为以后的研究作了必要的准备. 

数字特征是描述随机变量特征的有效工具，它虽然不像分亊 
函数那样完整地描述了随机变 f , 但是却具有很多伏 :点： 它较集 
中地反映了随 机变量 变化的一些平均特征（事实上敷字特征多是 
某种平均 值）； 其次，大部分最重要的分布函数都由一、两个数字 
特征完全砩定，而数字特征较易 求得； 最后，最常用也是最重要 

的儿个数字特征-数学期望、方差、相关系数一一都有明确的 

概率意义，同时又具有良好的性质.所有这些都决定了数字特征 
在概率论与数理统计中的重要地位. 

特征函数与分布函数 一一 对应，它虽然不像分布函数那样有 
直观的概率意义，但却有好得多的分析性质，因此它是解决某些 
分布问题的有乃工具，特别在处理独立随机变責和的分布问题上 
占有极重要的地位.关于特征函数与分布函数关系的另一些方面， 
将在下章中进一步讨论. ' 

数字特征与特征函数都可以看作是分布函数的某种变换，而 
母函数则是概丰论 t 引进的第一个变换，它在概率论发展史上有 
很大作用.到7现在，母函数以它的简 0 月性以及在某些场合的有 
力应用而保持了它一定的地位. 

我们用特征函数作为工具研究了多元正态分布，建立1它的 
许多重要性质，这些良好性质从一个方面决定了正态分布在概率 
论与数理统计中的重要地位，正态分布重要性的另一方面——常 
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见性—一将在下章中得到深入的讨论. 

最近几十年来，信息，信息的传输、变换与处理的概念正在 
滲入各种各样的学科，大大加深了人类对客观世界的认识.信息 
的概念与随机试验、概率分布等概率论概念密切相关，作为不肯 
定性度量的熵可以看作是概率空间的某种数字特征，因此我们对 
这些重要概念作了初步的介绍. 

本章的作用是承上启下.本章引进的两个基本概念——数字 
特征与特征函数 一一 将在极限定理的研究中起重要作用. 


习题四 


1- 设随机变量 f 只取非负整数值，其概率为尸 K 二幻 
是常数，试求反 及汉. 

2. 袋中有々号的球6只，々=1，2， …，？ 1，从中摸出-球，求所得号码 


的数学期望. 


3. 随机变量"取非负整数值的概 率为九 


B n 


决定 A 与凡 

4-(1) 证明关于示性函数成立如 K 公式: 


已知 = d ，试 


= • la ； Iaub™ 1 — 

(2) 利用示性函数导出概率加法公式 （1.5.6). 

(3) 有五个队参加的比赛中，每个队与别的队都比赛一场，若每场比赛 
参赛双方各有50%赢的机会，试求整个比赛既没有不败的队也没有不胜的 
队的概率. 

5. 若事件 Z 在 第/次 试验中出现的概率为外，设 P 是事件乂在起初《 
次独立试验中的出现次数，试求£"及 

6. —袋中含有 a 只白球， A 只黑球，从中摸出 4 只求摸出 
白球数 A 的数学期望. 

7. 袋中有《张卡片，分别记上号码1，2,…，；1,从中有放回地抽出々 
张卡片来，求 所得号 码之和^的数学期望及方差. 

8. 某城市共有 W 辆汽车，车牌号从1到若随机地（可重复）记下 
„辆车的车牌号，其最大号码为 I 求砹. 
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9. 试证： 若取非负整数值的随机变量 6 的数学期望存在，则 

o : 

Ee =^ P {^ k } 

1 

10. 若随机变量6的分布函数为 F (: r ), 试证： 




<)0 

[1 — 厂 0)]<1 


0 


F(x)dx 


特别地，若^取非负值，贝 ij 


E $ = 






[1—F(x)]dx 


11. 若随机变量彳服从拉普拉斯分布，其密度函数为 






x < oo , A >0 


试求莰及 Df . 


12. 若分子的速度的分布密度函数由麦克斯韦分布律 给出: 


p ( x ) 


4> r : 


a 3 



， Jo>0 


x^O 


其中 a >0 是常数，试求分子的平均速度和平均动能（假定分子的质量等于 


)♦ 


# 


13. 若 I , 6相互独立，均服从 W ( a ， a 2 )， 试证: 


E max (^ ， f 2 ) 






14. 设 / Gr ) (0< r < cx ,) 是单调非降函数，且 /( x ) >()• 对随机变量 


^ 若£/(1匀） <^oo f 则对任意* r >0, PUei >^ c }< 


/(x) 


E / aei ) 


15. 若&，匕 ，…，^为正的独立随机变量，眼从相同分布，密度函数 


为 / Gr )， 试证 


E 


匕+芒2 +…+心 ) 
( 令1 +芒2+…+芒” 


k 


n 


16. 袋中装有 AT 只球，但其中白球数为随机变量，只知其数学期望为《, 
试证从该袋中摸一球得到白球的概率为; 

17. 甲袋中装有 a 只白球6只黑球，乙袋中装有《只白球卢只黑球，现 
从甲袋中摸出 r ( c ^ a ^ b ) 只球放入乙袋中，求从乙袋中再摸一球而为白球 
的概率. 
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”8. 袋中有 a 只白球 6 只黑球，每次摸出一球后总是放入-只甶球，这 
样进行了 n 次之后，再从袋中摸-只球，求它是白球的概率， 

*19. 甲袋中有 a 只穴球6只黑球，乙袋中有 r 只白球 d 只黑球，从两袋 
中各 摸出- 球，并交换放入另 •一 袋中，这样做了《次之后，再从甲袋中摸出 
一球，求这球是白球的概率. 

20. 现有《个袋子，各装有 u 只白球6只黑球，先从第一个袋子中摸出 
一球，记下颜色后就把它放人第二个袋子中，再从第二个袋子中摸出一球， 
下颜色后就把它放入 第：? :个袋子中，照这祥办法依次摸下去，最后从第《个 
袋子中摸出一球并记下颜色，若在这 n 次摸球中所摸得的白球的总数为6’„， 
试求 ES n . 

21. 在物理实验中，为测量某物体的重量，通常要重复测量多次，最后 
再把测量记录的平均值作为该物体的重量，试说明这样做的道理. 

H 若…，夂是独立随机变量， DH ， 试找“权”山 ，❼， …， 

a “它们满足 = ，使^的方差 最小. 

/-I 

23. 设随机变量 •_ •，气^ («>m) 是独立的，有相同的分布并 
且有有限的方差，试求 S = t 十…十^与7 1 = ^„ +1 十1 +2 +〜+匕 1+#( 两和之间 

的相关系数. 

24* 若$的密度函数是偶函数，且 £P<oo , 试证旧与 f 不相关，但它 
们不相互独立 • 

25 •若 （ f ，7) 的密度函数为 

f 士 ，+ > ,2 <1 

p ( x , y )=^< n 

U ，： 2 +y>i 

试 验证： f 与 7 不相关，但它们不独立* 

26, ^U = aX + b , V = cY ^ rd , 试证 t/， V的相关系数等于X， y 的相 
关 系数. 其中 《c>0. 

*27, 若 f 与7都是只能取两个值的随机变量，试证如果它们不相关，则 
独立. 

28. 若$，$ 2 , 6是三个随机变量，试讨论 a) h 两两不 相关; 

(2) D + =^+1)^+%； (3) 段 名6 3 = £^ • £1 • £6 之间的 

关系. 


» 
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29. 若令， 7服从：元正态分布 ， = 汉=1， Et } 二 b ， Dr ^ l ， 证明: 


芒与7的相关系数 r = cosq 7 r , 其中 q ^ P {(^-- a )( 7 J — b )< 0 }. 




30 •设 （ f ，7) 服从二元正态分布 ， £f = £v = 0 , = 试 


证 


£max ( 芒， 7) 




Vt 


31* 设 f ，7独立，均具有相同分布 N ( a ， a 2 )， 试求 〆 +的与 wf+W 


的相关系数. 


32. 柏累托 （ Parem ) 分布 的密度函数为 


f 


p ( x )=< 



， x^A 

工 十1 

0， 

x<iA 


这里 r >0, A >0. 试指出这分布具有/>阶矩，当且仅当/ >< r . 
33. 若 f 的密度函数为 


f 


pix ) 


2 \x \ (In jx |) 2 


0, 


， kl > 

其它 


试证对于任何 a >0, £|^| 


# 


34. 若 H 艮从 AM “ d 试求 £| 芒一 


其中 * 为正整数. 


* 35. 记山二£ | 芒|*，若 a »〈 oo ，试证 Y^k ，是=1，2 ，…， n — l . 

36. 甲袋中装有5 R 白球，7只黑球，3 R 红球，乙袋中装有4只白球， 
4只黑球，7只红球，试问从哪一个袋中取出一只球有较大不肯定性？ 

37. 试求儿何分布的熵. 

38. 试求二项分布的熵. 

39. 若以^及/?分別记二进制信道的檐入及输出，已知尸 { a = l }=/>， 

= 1 — p ^ P {^= 1 I a = 1} = q f P{fi = 0 I a = 1} = 1 1 ja = 0} ― 

= = l _ r ， 试求输出中含有输入的信息量 * 

**40. 在12只金属球中，混有一只假球，并旦不知道它是比真球轻还是重， 
用没有砝码的天平来称这些球 .（1) 试问至少需要称多少次才能査出这个假 
球并确定它是比真球轻或重 .（2) 给出一种称球方案. 


4 L 试用母函数法求巴斯卡分布的数学期望及方差. 

42. 设$是一个母函数为 P ⑴的随机变量，试求下列各概率所对应的母 
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t 


函数： 

(1) P {^> n }： (2) P \^=2 n \. 

^43. 在伯努利试验中，若试验次数 v 是随机变量，试证成功的次数与失 
败的次数这两个随 机变量 独立的充要条件是〃服从泊松分布 • 

*44 .设是一串独立的整值随机变量序列，具有相同概率分布，考虑 
和7=匕+5十…+乞，其中 w 是随机变量，它与相互独立，试用 （1) 
母函 数法； （2) 直接计算证明 

Etj=Ev • E^k iD^j—Ev * Df*+/)v ♦ (ED 2 

45. 某公共汽车站在 [0, f ] 中来到的乘客 批数； /服从参数为 A / 的泊松 
分布，而每批来到的乘客数是随机变量，来 n 个的概率为/>«，” = 0, 1，2, 
…试求[0, /] 中来到乘客数7的母函数及数学期望. 

46. 试用母函数法证明二项分布及泊松分布的再生性. 

47. 若分布函数/ ^( jr ) = 1 — F (_ x 十 0) 成立；则称它是对称的；试证分 

布函数对称的充要条件是它的特征函数是实的偶函数. 

48. 试求 [0, 1] 均匀分布的特征函数. 

• 49. 一 般柯西分布的密度函数为/» Cr ) • A 2+ (t — A>0 , 试 

证它的特征函数为 卟 ' ， 利用这个结果证明柯西分布的再生性. 

50. 若随机变量 S 服从柯西分布， A = l , 而试证关于特征 
函数成立着 

f^(t)=Mt) • f ， u) 

但是 f 与7并不独立. 

51. 设 I , …，乞相互独立且均服从同一柯西分布，试证：1 (^4 - 

n 

&+…+乞）与6同 分布. 

n 

52. 若， f 2 , … ，乞 相互独立且服从相同分布 W (0, 1) ，试证7= H 行 

1= 1 

服从参数为《的；^分布，并说明 5 C 2 分布也有再生性. 

*^3. 求证： 对于任何实值特征函数/“)，以下两个不等式 成立： 

1 — /( 20 ^ 4(1 — fit)) 

1 + /(^)^2(/(/)) 2 

* 54. 求证，如果/ (/) 是 相应？ 分布函数 F Gr ) 的特征函数，则对于任 

何: r 值恒成立 . 
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fU)e- UI dt^FLx-\-0)-F(x-0) 

T 


55. 随机变童 f 的特征函数为 /(/)， 且它的《阶矩存在，令 



壶 log ’ ⑴ 


k^n 


称厶为随机变量 f 的 it 阶半不变置. 试证7=^+办 （办是 常数）的 i ( k >\) 
阶半不变量等于 

56. 试求出半不变量与原点矩之间的关系式. 

57 •若 （6, 7) 眼从二元正态分布，试求的分布密度函数- 
58. 设 …， 乞相互独立，具有相同分布 W (a V )，试求 



的分布，并写出它的数学期望及协方差阵 • 再求的分布 

i= 1 


密度 • 

59_ 若 f 服从二元正态分布 W (0,叉)，其中 


4 2\ 

\ 2 W 

试找出矩阵使€=4〜且要求 rj 服从非退化的正态分布，并求 q 的密度 
函数. 

60. 证明： 在正交变换下，多元正态分布的独立、同方差性不变 • 
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第五章极限定理 


§ 1. 伯努利试验场合的极限定理 

一、 问题的提出 


在第一章中我们已经 指出： 人们在长期实践中发现，虽然个 
别随机事件在某次试验中可以出现也可以不出现，但是在大量重 
复试验中却呈现出明显的规律性，即一个随机事件出现的频率在 
某个固定数的附近摆动，这就是所谓“频率稳定性对于这点， 
至今为止，我们没有给予理论上的说明. 

数学上怎样来描述在一定条件下的大量重复试验呢？我们在 
第二章已经建立了伯努利试验这一概率模型，并指出它可以作为 
在一定条件下的重复试验的数学模型.在伯努利试验中，各次试 
验是相互独立的，在每次试验中，我们所关心的事件 A 出现的概 
率保持不变，这些特征可以看作是从数学角度把“在一 
定条件下”、“重复试验”等等用语的涵义加以明确化. 


在伯努利试验中， 若以 A 记 n 次试验中4出现的次数，则& 

n 

便是在这〃次试验中事件 a 出现的频率，所谓频率稳定性无非是 


指当试验次数〃增大时，频率&接近于某个固定的常数. 

n 

这个固定的常数就是事件 a 在一次试验中发生的概率.由此 


可见，讨论 频率& 的极限行为是理解概率论中最基本的概念—— 

概率，所不可缺少的.正是这个缘故，在概率论的发展史上，极 
限定理的研究一直占重要地位，而它的发源地就是伯努利试验这 
个概型. 


•251 • 


从前几章的讨论中我们知道，内是随机变量，它服从二项分 
布 

I V 

P { jut n = k ) — p k q nk ， 是:二0， 1， 2 ，…， n 

\kj 

其数 学期望£仏= 矽， 能 D 〜 = np q . 这在一定程度上帮助我们 
进一步了解了频率$的性质.但是我们更需要知道的是《很大时 

或 f 的性质. 

显然，当《很大时，内一般也很大，所以直接研究 A 不很恰 
当，还是研究频率 △ 为宜. 因为£(巧卜/所以当 

n \ n I \ n I n 

时，频率的数学期望保持不变，而方差则趋于 0. 我们知道 
方差为0的随机变量是常数，于是我们自然预期频率将趋于常数 

P (即事件 d 发生的概率).但是频率 f 是随机变量，关于它的极 

限又将采用何种提法呢？ 

一种提 法是： 当《足够大时，频率 f 与概率/>有较大偏差的 
概率很小.用数学语言来讲，就是要 证明： 对于任意 e >0, 

limFl — — p ^ e | =0 (5.1.1) 

n —OO [ Tl ) 

或者它的等价的式子成立，即 

lim . P | — — p 〈€!=1 (5*1.2) 

rt-，oo [ 71 j 

历史上，伯努利第一个研究了这种类型的极限定理，在1713 
年发表的论文中（这是概率论的第一篇论文!），他建立了 
(5.1. 1)，这是一大类概率论极限定理 —— 大数定律 (law of large 
numbers ) 中的第一个， 

关于频率接近于概率还有其他提法，譬如博雷尔建立了 

I 

pl \ im ^= p ) = l (5. 1.3) 

\ Tl j 
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从而开创了另一种形式的极限定理——强夭数定律的研究. 

本节只讨论伯努利大数定律，关于强大数定律的讨论将在§ 4 
中进行. 

为了研究内的极限行为，可以讨论它的分布尸彳/4<幻的变 
化 情况. 但是由于吵， D 内 = 因此对于固定的1来考虑 
/ M / vCz } 的极限不会有多大意义，因为它将趋于0,所以通常改为 
研究“标准化”的随机变量 


的分布函数 


r _ f^ — np 

— — y - -- 

vnpq 

P{^<X) 


(5. 1- 4) 


的极限行为， 由匕的 分布函数不难 求得& 的分布函数. 

关于上述分布，已证明它的极限分布是正态分布 W (0, 1)， 
即 


lim 尸 {& < 了 }= 

Ff—► OO 



(5.1-5) 


这个结果最早由法国数学家祿莫弗 （De Moivre ) 建立，他对/> = 
I 证得了上述结果.后来，拉普拉斯推广到0</><1的一般场合， 


那是另一类概率论极限定理 


中心极限定理中的第一个. 


下面将会看到极限定理 （5. 1. 5) 的研究直接联系到大 n 场合 
的二项分布的计算，这就顺便解决了第二章遗留下来的一些计算 
问题. 


形如 （5.1.5) 的收敛于正态分布的极限定理的研究，在长达 
两个世纪的时期内成了概率论研究的中心课题，因此得到了中心 
极限定理的名称. 

经过长期的研究，人们认识到，乂具有性质 （5.1.1) 及 
(5.1.5) 是由于它是独立随机变量之和，事实上，若令 
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|1， 第 U 欠试验 出现乂 
' = io , 第 / 次试验不出现 A 
则 

A +彡2 +…+•芒” 

这里&，心，…，乞是相互独立的.以后我们将会看到，对于一般 
的随机变量〖=1，2, •••,«，也可以研究它们的和的极限定理， 
并且在一定条件下，这个和也具有类似于 / A •的性质，关于这些问 
题的研究就成了本章的主要内容. 

为了叙述方便起见，我们引进如下定义. 

定义 S . 1.1 若…， f n , …是随机变量序列，令 

= 迅 + - …七氕 (5.1.8) 

n 

如果存在这样的一个常数序列 a 2 ，…， a ,， …，对任意的 e >0, 恒 
有 

limF { a ” |〈 e } = 1 (5.1.9) 

则称序列脤从: i ： 数定律（或大数法则). 

在以后的讨论中，我们几乎总是假定 f 2 , … ，乞， …是独 
立随机变量序列，显然，伯努利大数定律是一般大数定律的一种 
特殊场合. 

关于中心极限定理，我们总是对独立随机变量序列 A ，彡 2 ， …， 
匕，…进行讨论，假定及汉,存在，令 


(5.1.6) 

(5.1. 7) 



我们的目的是寻找使 


limP{^ n < x } — 



(5. L 10) 


(5 .L 11) 
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成立的条件. 

一般，若独立随机变量序列 … ，乞，…的标准化 和？， 
使 （5. 1.11) 成立，则我们称 {6} 服从 中心极限定理 (central limit 

theorem ). 

显然，棣莫弗一拉普拉斯极限定理是中心极限定理的特例. 

二、伯努利大数定律 


我们将证明一个比伯努利大数定律更强的命题. 

1. 车贝晓夫大数定律 

车贝晓夫大数定律设&，匕，… ，乞， …是由两两不相关的 
随机变量所构成的序列，每一随机变量都有有限的方差，并且它 
们有公共上界 

<C, D^ 2 <C, De„<C, - 
则对任意的^ >0， 皆有 

limF ( 丄文 6—丄文悦 < e ) = l (5.1.12) 

一 1 n frf n I 

[证明]因为两两不相关，故 

: A 

再由车贝&夫不等式得到 



n n D \ 

p{ 丄 Z ： t— 丄 ! >1— 

\ \ n n I £ 邮 

所以 

n £ 2 

于是，当 / i — oo 时有 （5.1.12), 因此定理得证. 

这个结果在1866年被俄国数学家车贝晓夫所证明，它是关于 
大数定律的一个相当普遍的结论，许多大数定律的古典结果是它 
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的特例；此外，证明这个定律所用的方法后来称为矩法，也很有 
创造性，在这基础上发展起来的一系列不等式是研究各种极限定 
理的有力工具. 

马尔可夫 （ Map KOB ) 注意到在车贝晓夫的论证中，只要 

匕卜。 (5-1.13) 

则大数定律就能成立，通常称条件 （5.1.13) 为马尔可夫条 

件. 

马尔可夫大数定律 对于随机变量序列… ，乞，…若 
(5.1.13) 成立，则对任意£>0，均有 （5.1.12). 

车贝晓夫大数定律显然可由马尔可夫大数定律推出；更重要 
的是马尔可夫大数定律已经没有任何关于独立性的假定.研究相 
依随机变量序列的大数定律是近代概率论的课题之一，但是这已 
超出我们讨论的范围. 

2. 伯努利大«定律与泊松大教定律 
伯努利大数定律设 A 是 n 次伯努利试验中事件4出现的 
次数，而/>是事件 X 在每次试验中出现的概率，则对任意£>0,都 
有 

^ P {\^~ P \ <€ } =1 (5a * 14) 
[证明]定义随机变量6如（5.1.6)，则 

= p y i = 

而 

既 3-P 

故由车贝晓夫大数定律立刻推出伯努利大数定律.显然，伯努利 
大数定律也可以通过车贝晓夫不等式直接加以证明： 
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历史上，伯努利大數定律是通过直接展开和繁复的计算才证 
得的. 

泊松大数定律 如果在一个独立试验序列中，事件4在第走 
次试验中出现的概率等于/>*，以记在前《次试验中事件4出 
现的次数，则对任意 e >0, 都有 

\impl 士 」汁朽 + …+各 <£ ) = 1 (5.1.16) 

… { \ n n } 

[证明]定义匕为第々次试验中事件 a 出现的次数，则 

E^t = pk » —pk ( 1 — Pk) 

再用车贝晓夫大数定律立刻可以推出 (5.1.16) 

泊松提岀了不同于伯努利试验的另一种独立试验模型，并导 
出泊松分布以及证明了上述大数定律，从而奠定了他在概率论发 
展史上的重要地位. 

3. 大数定律的重要意义 

人们积累的大量经验告诉我们，具有很接近于1的概率的随 
机事件在一次试验中几乎一定要发生；同样，概率很小的事件在 
一次试验中可以看作是实际不可能事件.至于概率小到何种程度 
才能看作是实际不可能事件则要视事件的重要性而定，有百分之 
一可能性含有染菌的药物是应该废弃的，但含有百分之一次品的 
钮扣则问题还不太大. 

因此在实际工作及一般理论问题中，概率接近于1或0的事 
件具有重大意义，概率论的基本问题之一就是要建立概率接近于 
1或0的 规律； 特别是大量独立或弱相关因素累积结果所发生的 
规律.大数定律就是这种概率论命题中最重要的一个. 

观察个别现象时是连同一切个别的特性来观察的.这些个别 
的特性往往蒙蔽了事物的规律性.在大量观察中个别因素的影响 
将相互抵消而使总体稳定.例如，虽然每个气体分子的运动带有 
很大的随机性，但是作为气体平均特征的压力、温度等却是稳定 
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的，大数定律说明了这种稳定性.古人用“定律”来称呼这类命 
题，可见其重视的程度. 

伯努利大数定律建立了在大量重复独立试验中事件出现频率 
的稳定性，正因为这种稳定性，概率的概念才有客观意义.伯努 
利大数定律还提供了通过试验来确定事件概率的方法，既然频率 

f 与概率有较大偏差的可能性很小，那么我们便可以通过做试 

验确定某事件发生的频率并把它作为相应概率的估计.这类方法 
称为参数估计，它是数理统计中的主要研究课题之一，参数估计 
的重要理论基础之一就是大数定律. 


三、嫌莫弗一拉普拉斯极隈定理 


大数定律只断言 P 




P 


> I 当 


〜时趋于0，也即 


n 


接近于/>，而祿莫弗一拉普拉斯极限定理则 给出仏 的渐近分布的 
更精确表述.下面定理给出了两个结果.第一个结果提供了尸 
= k ) 的渐近表达式，这类结果一般称为局部极限定理.第二个结 

果给出了标准化随机变量的渐近分布，称为积分极限定理, 

v npq 

它是一般中心极限定理的特例.这两个结果既有区别也有联系. 

定理 5.1. 1 (棣莫弗一拉普拉斯）若内是 n 次伯努利试验 
中事件 A 出现的次数，0</><1,则对任意有限区间[«，幻： 


(i ) 当 a^x { 


k — np 


<bR 


时， 一 致地有 


P{p n = k} + 


1 'hk 


npq y/2n 


1 


(5. M 7) 


(ii ) 当 


时， 一 致地有 


pU < 



np 


vnpq 


<b 


► 


*6 

(p{x)dx 

J a 


(5. L 18) 


其中 f ( x ) 


.2 




/2 


V2n 


(—qo<Ct<oo), 


_ 
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[证明]先证局部极限定理，我们将给出一个比（5_1. 


rr 


更为精确的渐近式. 

因心只 能在有限区间 [ a ， «中取值，故当 n 


np-\~x k v npq 


n —— k 


nq — x k 


/ npq 


由斯特林 （ Stirling ) 公式: 


m 


2^ mm m e 


o<o m < 


12m 


可知 


P {^ k ) ^-^ j y p q 


/2 itnn n ^ n 

^/2/^ kk k ^ k ^/2 Kjj J e 


P k ^ 


n 


—U 


= 1 1 ( 唆 

\fnpq\ 々 

其中 6 = 6 n — 0 k^Qn k ^ 因此 


f T / nq 广 - *+ 

i n —— k 




由 （5. 1. 19) 及 （5* 1.20) 知 


np = ^<tp 


七， 0 = 1 -工 


nq 


nq 


我们将利用展开式 


x 2 3 4 

ln ( l + x )= x — 2 ™ + — - 


时， 

(5. 1. 19) 


(5. 1. 20) 


(5.1.21) 


(5*1*22) 


(5* 1. 23) 


(5* 1. 24) 


(5.1.25) 


来对它们进行 估计. 这个展开式当 一 时收敛，但只有对绝 
对值很小的那种值才收敛得快.现在，当《充分大时， 

fj 

■ J I ■■■ ■■ - ■- f ♦ ^-4 I J- *~~C-~*■ I k- . • _ - ^ * . _—■ —■ • _ _ - h _ fa » fei 


及都很小（因此，当/ >=0 及/ >=1 时不 能用； 此外，当/> 

或9很小时，渐近展开式引起的误差也较大，这时我们已推荐用泊 
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4；,- ^1 -=T 七并尹― ：+■ ，：•： 讣 t:r$r :， 埤雄 HJvt 


松逼近公式），所以 

ln( UnpqP {ju n — k} 


々 + 7 In 


k 


np 


n —— k ~\— - 


In 


n — k 

nq 




6 — np-\-x k \/ npq^r— In 

\ 乙 


1+ 勾 



q 


n/) J 


nq — x k / npq + — In 


L 


l —a 





Q - 


np-\-x k Vnpq 


參 





q , ^lq vnpq oo\q 2 丄 … 

A l ^ 八 - ~I ~ o o " W n "J _ • • 


np 2np 


3n 2 p z 


4n 2 p 


nq ― x k 


\ 


npq + ^ 





x “/ 克—奔—笔十… 


nq 2nq 


3n 2 q 2 


in 2 q 2 




Q - 





vnpq 


(xl — 3a：*) 



— (士; 


(5. L 26) 


因此 


P {^ n = k } = 


2 


npq 


exp 


2 



(q~p)Cjot — Sx k ) 
6 Vnpq 


o 


/ i 、 


n 


Vnpq 


e 


1+ H (3 ^) +o 

6 v npq 


1 


^ J 



(5. 1. 27) 

取其第一项即得 （5. l . l 7 )， 因此我们已证得了局部极限定理. 
显然，我们得到了更精确的估计式。又知当 p = q 及 ：4—3 Xi = 0 
时，近似效果尤佳. 


« 
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下面转入证明积分极限定理. 


Pla^^<b 

V npq 


十 a / npq ^} jL n <Cnp + b Vnpq ) 


c 

^ i P ^ 


k 


(5* 1. 28) 


上式中 々 i 为不小于 np + a ▲抑的最小整数，々 2 为小于吵 


_的最大整数，由局部极限定理知当〃充分大时，对任给 


0,有 


P{fJL n ^k) 


^npq 


(<p(x k )-\-e k ), Ie* I<e 




奉 •《 


, k 2 ) 


代入 （5.1.28) 式得到 


Pla^^<b 

y ^ P<i 


k = 


Vnpq 


i 

^sr^s 

< p ( xk )-^ 


e k 


i Vnpq 


因为有 


“ 

E 


A 


k 


! 


< 


V npq 


( k 2 — k x + 1 )e < 


(fe — <x ) ynpq H~ 1 


Vnpq 


€ 


故当 


时，注意 A 的增量为 


vnpq 


，就得到 


P(a < 


f^n — np 




<b 


n 


<p{x)dx 


h/ 


定理到此完全证毕. 


利用 


/2 k 


r*_ 


/ 


z dx = l . 不难证明在积分极限定理中，当 


一 oo 


， 办二+⑺时仍然 成立. 
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四、 棣莫 弗一拉普拉斯 极限定理的一 些应用 


棣莫弗一拉普拉斯极限定理虽然是作为二项分布的近似而推 
导出来的，但是它的重要性远远超出数值计算的范围.对它的各 
种推广形式的深入讨论将在以后几节进行，这里我们先介绍一呰 
它的具体应用，其中有些解决了第一、二章遗留的问题. 

[导岀伯努利大数定律]积分极限定理断言， 仏的分 布渐近 
于正态分布 W { np , npq 、， 因此伯努利试验中事件 A 出现的频率 

&的分布渐近于正态分布# (/>， 姓). 这里可以想象，当 n—w 

Tl Tl 


时， 


P-n 


的分布会收敛于退化分布 


l(x — p) 


1 ，工 >p 


这正是伯努利大数定律所确定的事实.下面来严格证明. 
因为 e 固定，对任意正数/,只要 n 足够大，就有 


F 

npq〈en 


因此 


f^n—np 

V npq 


</ C 


li n — Tip 


<e 


所以对大的 n ， 


p [ ^ <l }^ p {\^\ <£ 


由积分极限定理，当 ^ 


时，上式左边收敛于 




2 dx 


对于任给^>0,可以选 Z , 使得上面积分值大于 1_1 因此对充 
分大的 W 有 

p\ 一 p < 6 } 〉 1 一 S 
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这就证明了伯努利大数定律，从这里也可看出，积分极限定理比 
大数定律更精确. 

[用频率估计概率时误差的估计]由积分极限定理 


P 








f „ ) 

-<P 


= 2 少 

〆 、 

eJ^L 


{ ^ pq\ 


^ pq\ 


{ ^ pq) 


(5. 1. 29) 


这个关系式可用来解决许多计算问题. 


第一类问题是已知 n , />， 


求概率尸 


Mn 


P 


O ;这时 


只要利用 （5. 1. 29) 并查正态分布函数少 （ x ) 的数值表就可解决, 
这类问题在二项分布计算中经常会遇到. 


第二类问题是要使$与/>的差异不大于定数 e 的概率不小于 

预先给 的数义 问最少应做多少次试验？这时只需要求满足下式的 
最小 n ， 


2 少 t lIL - 1 >/? 

{ ^ pq) 

这也可通过査表求得. 

第三类问题已知 n 及/?，求 e ， 这类问题是在进行误差估计时 
提出来的.解法 如下： 先找•^使 

这时 



即为所求.若/>不知道，则利用舛<+，有下列估计式 




礦 
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这类估计在蒙特卡洛方法中很有用处. 

[局部极限定理在二项分布计算中的应用]局部极限定理给 
出 


n 


丄太八 n _ * 

P q 


* 


vnpq v2^ 


jfe — up 

e~Tl 


2 


1 (5.1,30) 


这个事实由图 27 表示出来，其中阶梯函数给出概率 


i “ \ 


n 

k 


P k < r k ， 而粗线则给出对应的正态分布密度函数曲线. 


0 . 


0.1 



4 5 6 


9 10 11 12 13 14 15 



图 27 二项分布的正态逼近 

我们来利用局部极限定理对 [ ^ /> V ^ 进行近似计算. 

\纪 I 


因为 


<p (X) 



/2 tt 


e 



oo<a*<oo 


(5. 1.31) 


有专门数值表，当 n 较大时，对二项分布的计算可用下列近 似式: 


n I 

ki 



(5. L32) 


其中 a = 用这种方法计算当然会有误差，但实践证明（也 

vnpq 

能利用 （5. 1_ 27) 作理论分析） ，当， 不太接近于0或1，而 w 又 
不太小时，都能得到良奸的结果， 
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下面就用这种办法来解决第二章 § 4 中提出的一些二项分布 
计算问题. 

例3中要求计算办 (5;500,0.01 )=d (0.01) 5 • (0*99) 4 ' 

5 

利用 （5, h 32) 


b (5; 500, 0. 01) 


<p 


5-500 X 0. 01 


/500 X 0, 01 X 0. 99 ■ /500 XO . 01 X 0- 99 


/4. 95 


：<p (0) 


/ 4^95 


:二 X ()• 



第二章中已指出 H 5 ; 500, 0.01) 的精确值是 0. 17635,这里 
/ >=0. 01很接近于0,我们用近似计算得到的数值的有效性还达 
到小数点后两位，由此可见用局部极限.定理计算的近似程度是很 
好的. 

再来计算例4 (1), 那里要求计算纟(40;10000,0. 005), 利用 
(5. 1. 32) 


办 （40;10000,0. 005) 


n 

( 40-10000 X 0. 005 

yiOOOOXO - 00 「) X 0. 995 

(/10000 XO . 005 X 0* 995 / 


(1- 4) =~^ X 0 . 1497 = 0. 0212 

/• 05 7. 05 

而精确值为0.0214,准确度甚高. 

[积分极限定理在二项分布计算中的应用]积分极限定理给 
出 


P 



— 0(a) 


(5. 1. 33) 


其中少 ( x )=_^ 二 

/2tt ^ 


e ^是正态分布函数，利用它可以计算 


形如/^<仏<々 2 }的概率. 

因为当《充分大时，6 «， />) 即使对于最可能成功次数， 

其数值也很小，这时讨论成功次数等于某数々的概率，即求 / M/a 


• 265 * 




= k ] 便没有太大意思；相反，计算 N 的值落在某一区间 [ h ， 
h ] 的概率倒十分重要，因此积分极限定理在二项分布近似计算中 


更为有用. 
我们有 








I k z —np 
\/ npq 


I 


—伞 




k 1 — rip 
/npq 


(5.1.34) 


细察图 27 可以看出，在用连续型分布正态分布逼近离散型分 


布二项分布时存在着偏差.对应于离散值7, 8, 9, 10的矩形面 
积，相应的该是 6. 5<- r <10. 5上的曲边梯形面积，因此下面的修 
正公式，常能得到更好的近似 效果： 


P{k l ^JLt n ^k 2 } 



k 2 —— w /> + 0. 5 \ 
^npq I 


l k x ~np — 0. 5 
— <P - - - - 

i 


(5 .h 35) 

当 P 不太接近0或1，而;2又不太小时，用这个近似式能得到 
良好的结果. 

例如，我们来完成第二章§4中的一些计算.例4 (2) 要计 
算尸{/<70}，利用 （5.1.35) 

P {/^<70} 

〜I 70- 10000 XQ . 005 + 0- 5| _J -10000 X 0. 005 —0. 5 ) 

〜少 （ 710000 X 0* 005 X 0. _ 995 / i /涵0万❼•万 o ¥3< H 5 
=少 （2. 91) -0 (-7. 16) =^(2.91) - [1— 少 （7, 16)] =0 - 998 

这里少 （7.16) 取为1，此外计算中还用到少（一 x ) =1—中（ X )， 

这由 p U ) 的对称性即得. 

再来计算例5，其中/> = ~^， w =5. 4 X 10 22 . 


尸 n " 


矽丨 >2,7 X 10 12 }=6 


― tip 


2. 7 X 10 12 

>7— 

a /5.4X10 22 X^ 
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p 


/i — np 
/ npq 


> 2 . 32 X 10 


V 2 n 




IT 


t/2 dt 


23 - 2 


这个数值非常小，从公 Cr) 的数值表中不能找到，但我们可 
以用下面方法对它进行估计. 


由于对=>0有 




—/ J 




V 


te~ i/z dt 


( 5 , L 36 ) 


利用它可以得到 


v2tt 」 




e^ /2 dt<^z 

23 2 /2 
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23 . 2 


<10 


100 


这概率非常小. 

现在 我们能够解决第一章§ 1中提出的用电问题了.该问题 
可以重 新叙述 如下： 

某 车间有200台车床，它们独立地工作着，开工率各为0.6, 
开工时耗电各为1千瓦，问供电所至少要供给这个车间多少电力 
才能以 99. 9%的概率保证这个车间不会因供电不足而影响 生产？ 
这里的叙述已把问题数学模型化，提出了各车床工作的独立 
性假定，并把所谓能正常生产的要求加以明确化，这是在用数学 
解决生产实际问题时必须经过的一步. 

现在，这成为试验次数《 = 200的伯努利试验，若把某台车床 
在工作看作成功，则出现成功的概率为 0. 6. 记某时在工作着的车 

床数为乞则$是随机变量，服从 /> = ()• 6的二项分布.问题是要 
求 r ， 使 

r 

Pi ^ r } =^[ 20 l ° (0. 6)*(0. 4) 20 °-*>0. 999 (5* L 37) 

k=Q \ K I 

我们可以利用积分极限定理计算这个概率. 

4 

S r / 200 \ 

L ( 0 . 6 )' ( 0 . 4 ) 200 -" 

\ k / 



{ r— 200 X 0 , 6 + 0 * 5 ' 


! — 200 X 0 . 6 — 0 . 5 ) 


、 / 200 —X 0 . 6 X 0.4 ) 

_ 

( 7200 X 0 . 6 X 0 . 4 ) 
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r —— 11 9 * S ; 

=0 —— (-17.39) 

/48 / 

查表得 

r —119_ 5 _ n , 

' — o* 1 

-/48 

所以 

r = 141 

这个结果表明尸代<141}>0. 999,所以我们若供电 HI 千 
瓦，那么由于供电不足而影响生产的可能性小于 0. 001，相当于在 
8小时工作中有半分钟受影响，这在一般工厂中是允许的.当然不 
同的生产单位，可能提出不同的要求，那么我们可以改变 
(5.1.37) 右端的概率值，但是方法还是同样的. 

现在也能对高尔顿板这个试验作理论解释了.读者可能早已 
想到，近似小球高度的曲线是正态分布密度函数曲线.这完全正 
确.事实上，高尔顿板可以看作是伯努利试验的一个实验模型•如 
果我们把小球碰到钉子看作是一次试验，而把从右边落下算是成 

功，当然从左边落下就算是失败，这时就有了一次/> = +的伯努利 

试验. 小球从顶端到底层共需要经过”排钉子，这就相当于一个 
n 次伯努利试验，剩下的只是要说明为什么高度曲线会是正态分 
布密度函数曲线，这个问题留给读者思考. 

§ 2.收敛性 

从下节开始，我们将把在伯努利试验场合建立的极限定理推 
广到更为一般的场合，本节为此准备了必要的概念与工具. 

从上节的讨论中我们已经看到，概率论的极限定理研究的是 
随机变量序列与分布函数序列的某种收敛性，下面我们将给这些 
收敛性以明确定义并讨论它们的有关性质.这些结果对于深入研 
究概率论也有着独自的重要性. 

特征函数是研究极限定理的有力工具，从上章的讨论中我们 
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已经知道，它与分布函数互相唯-确定，本节中我们将证明这种 
对应还具有某种连续性，这些性质决定了特征函数在极限定理研 
究中的特殊地位.顺便还得到特征函数的充要条件，这个结果在 
平稳随机过程的研究中有基本的重要性.本节定理的证明都较长, 
初学时可以略去，后面用到的是结论. 


、分布函数弱收敛 


中心极限定理讨论的是分布函数列收敛于正态分布,事实上， 
在棣莫弗一拉普拉斯积分极限定理中，若记 


F n { x)=P 



np 


y/npq 




则定理的结论可以表述为 


F n (x)^0(x) 


这正是一个分布函数列{及 （ x )} 收敛于某一个分布函数少 Cr >， 
这种收敛对每一点 X 都成立. 

这个考察对于我们引进一般分布函.数列的收敛性定义很有帮 
助，在给出定义前，我们再来看一个例子. 


[例 1] 令 


0, 




F„(X)=4 


(5. 2. 1) 


1， 


〉- 




这是一个退化分布，它可以解释为一个单位质量全部集中在 


这一点的分布.当 


oo 


时，我们自然认为 { F n U )} 应该收 


敛于一个单位质量全部集中在 x = 0 这一点的分布，即 


FU ) 


0 ， x^O 

1 ， x>0 


但是，仏 （0) 三1，而 F (0)=0, 显然， K ( o ) 




F (0). 因此看来要求 


分布函数列在所有的点都收敛到极限分布函数是太严了.上例中 


* 
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不收敛的点是极限分布函数 FCx ) 的不连续点. 

定义 S . 2. 1对于分布函数列 { F „ U )} ，如果存在一个非降函 
数 FCr ) 使 

HmF„(^) = F(x) (5.2. 2) 

rt 一 OO 

在 FCr ) 的每一连续点上都成立，则称 F „( X ) 弱收敛于 Fix ) ，并记 
为 KCr )!^ Gr ). 

这样得到的极限函数是一个有界的非降的函数，我们也可以 
选得它是左连续的，但是下例说明，它不一定是一个分布函数. 
[例 2] 取 

f Of jr^n 

F n ( x ) = \ (5-2*3) 

11 ， x^>n 

显然 Um /^(: r ) = 0 对一切: r 成立，但 F ( x )-0 不是分布 函数. 

n—►oo 

当然，若已知分布函数列 Or )} 弱收敛于分布函数 F ( x ) 及 
GO ) ，则 F ( x ) = GCz ) 对~'切 x 成立. 

我们希望能得到一个分布函数列弱收敛到一个分布函数的充 
要条件，为此先建立一些重要的分析结果，这些结果对一般的有 
界非降函数列都成立，它们的弱收敛概念类似地定义. 

引理 5. 2. 1设 { F „ Cr )} 是实变量 x 的非降函数列，乃是 R 1 
上的稠密集.若对于 D 中的所有点，序列 { F „ M } 收敛于 FCr )， 
则对 FCr ) 的一切连续点 x 有 

limF„(j：) =Fix) C5‘2. 4) 

[证明]设 X 是任意点，选使由 
非降性知 

FAx ' 

因此 

F { x f )< limF Jt UXnr ^^ fl ( x )< F ( x ,/ ) 

U—»■ oo oc 

因为 Z ) 在 R 1 上稠密，故 
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F(x — 0)^limF„ (: r + 0) 

“DO 

所以对于 f U ) 的连续点工，成立 (5, 2. 4). 

下面证明海莱 ( Helly ) 的两个重要定理. 

定理 5. 2.1 (海莱第一定理） 任 一一 致有界的非降函数列 
中必有一子序列 { F „ A ( x )} 弱收敛于某一有界的非降函数 

Fix ). 

[证明]任取 R 1 上的一个到处稠密的可数点集 D ， 下面我们 
就取有理数全体，并排列为 n ， r 2 , •••，「„，…对于序列{仏 （ n )}， 
这是一个有界的实数序列，故必包含一收敛于某极限 G ( n ) 的子 
序列 ( n )}， 即 

limF ll „( r 1 )= G ( r 1 ) 

rt-^oo 

现在考虑序列 ( r 2 )}, 同样由于有界性，在其中存在子 
序列{尸 2 ,„0* 2 )}收敛于某一值 G ( r 2 ) .这时，同时成立着 

limF 2 ,«(ri)=G(ri), =G(r 2 ) 

a-*00 

继续这样做，可得序列 { F m .„ ( x )} ，使 

=G<r*) ，々 =1 ， 2, …， w (5.2.5) 

同时成立. 

这样，我们得到 JiFAx )} 的如下子序列 

F { A ( j :) , /^，“工）， jFV 〆 ：）， …， F Un ( jc )^ ••• 

F za (jc) , F 2 Ax) ^ F 2 , 3 (j:) ， … ， F Ztn {x)^ 


F mA ( x ) f F mt 2 ( x) f Ux )， …，••- 


(5, 2.6) 

这里每行都是前一行的子序列，而且它们具有性质 （5.2.5). 选 
取这个阵列的对角线元素 F „.„ Cr ) 构成新序列 { F n , n Cr )}， 由于 
它是从 { Fi ，《 (: T )} 分出来的，故 limF „, fl ( ri ) = G ( r 1 ). 其次，除第一 

K-^oo 

项外，它是由</^ 2 ，《(工） } 分出来的，故 limF n , n Cr z ) = G ( r 2 ). —般地， 





对任何固定的々，皆有因此对一切有理数 r ， 

limF^ fJ (r)=G(r) (5. 2* 7) 

灼一 

这里的 G ( r ) 是定义在有理数上的函数，它也是有界与非降的. 

对一切: reR 1 ， 定义 

F(x) ~supG(n) 

这函数在一切有理数上与 GXr ) 相等，它显然也是有界与非降的. 
由引理 5.2.1 知 

limF „,„( jc ) = f ( x ) (5.2.8) 

抒 —。 O 

对 FOr ) 的一切连续点成立，这就证明 了定理 5. 2. 1. 通常形象地 
称这个定理的证明方法 为对角线法. 

极限函数 FU ) 不一定左连续，但总可以改变它不连续点上的 
值使之左连续，这样的改变显然不影响 （5.2.8) 的成立. 

定理 5. 2. 2 (海莱第二定理） 设 / Cr ) 是 [a ,6] 上的连续函 
数，又 { F B Cr )} 是在[〜幻上弱收敛于函数 FOr ) 的一致有界非 
降函数序列，且 a 和6是 F ( x ) 的连续点，则 

lim f ijc)dF n (x)= f (x)dF ix) 

n 一 oo J d J a 

[证明]由函数 / Cr ) 的连续性推知，对任意正数 e ， 总可 
以找到一种分割，把区间0,幻分为 Dr 。， 々],[七， 

[ h ， (其中々 = JC N = b ) 等 iV 个小区间，使得当 
O *， 心 +1 ]时， I / U ) —/(心）|<£_利用这种情况，我们能导入一 
个辅助函数/☆)，它只取有限个值,并且当 ^<: r <: r * +1 时, / £ Cz ) 

= f (.Xk ). 

这样显然对的一切: T 皆有不等式 

\fix~) — / £ (x) | <Ce (5.2.9) 

在此我们可预先选取分点： ，* r 2 ，…， j : a ，- i ，使它们是 F ( x ) 的连续 
点.因为弱收敛于 F ( x )， 故当 n 充分大时，在此 N —1 个 
分点及上成立不等式 
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F{x k ) — F n {x k ) < 


€ 


MN 


( 5 . 2 , 10 ) 


这里 M 是 \f(x) I 在区间 a^xKb 中的最大值.显然 


rh 


f (jc)dF(x) — 


< 


u 








fix^AFSx) 


fixHFix)- 


a 


a 




/Ax)dFU) 


a 




h 


fAx)dF(x) 


a 




AU)dF n (x) 


a 


m/ 


r% 


h 


fAx ) dF n U ) 


a 


rb 


fU)dF n U) 


a 


(5-2. 11) 


由于 （ 5. 2.9 )， 


m 


b 


f(x)dF(x) — 


a 




rb 


AMdFix) 


a 


< e [ F ( M - F ( a )] 


(5. 2. 12) 


Ch 


/ e ( x ) dF „( x >- 


a 




rb 


/( x ) di ^( i ) 


a 


< e [ F „(6)- F rt ( t 2)] 


(5,2. 13) 


而由 （ 5. 2.9) ，（ 5.2.10 ) 可知 




rb 


rt 


/eU)dF(x)- Mx)dF n U) 


a 


a 


N-l 


2]/(工*)[尸（工奸1)_尸(1*)] 


0 


N-\ 


^2 f (jo k )lF n (^k^i) — F n (x*)] 


= 0 
N-] 


2,( 工 *) [尸 to + i )— F b ( x * +1 )] 


0 


V 一 1 


— X /(A) [尸 (A ) — F n (x k )2 


0 




e 


MN 


MN 


2 e 


(5-2. 14) 


因此 
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f (j：)dF (x) — f (jr)dF n ( jt ) 

J « J a 

^ elF ( b )~ F ( ay ]~\-£ lF n ( b )- F n U )^2£ 

由于 { F n ( x )} 的一致有界性，上式右边可以任意小，故定理 
得证. 

定理 S .2.3 (拓广的海莱第二定理）设 / U ) 在 （一 oo , 
00 ) 上有界连续，又 { F n ( X ) 丨是（一00， + oo ) 上弱收敛于函数 
F ( X ) 的一致有界非降函数序列，且 


limF n (-oo)=/X--c«),limir f) ( + oo)=F(H-oc3) 

/J—► OO ff —► OC 


则 


，oo 

lim f(x)dF n {x)= 

J -- oo 


fU)dF(x) 

J - 


[ 证明 ] 设 z<0, 石 >0 ,令 




CA 


f ( x ) dFAx )- 


CA 


fU ) dFU ) 




Jz 


rB 






B 


f{x)dF n (x) 




B 


A 


f ix)dF{x) 


f(x)dF n (^~ 


ij 




B 


显然 


_oo 

f (jr)dF n (x) — 

— oo 




oo 


f(j ： )dFU) 


j -^ rJz^rJz 


由于 / Cr ) 是有界的，存在常数 M >0, 使 |/ Cr )|< M . 又由于 
序列 ( KCr )} 的一致有界性，只要 A 与 B 的绝对值充分大，并使 A 
和 B 是 FCr ) 的连续点，而7!也取得充分大，则可使，， J 3 小到预 
先给定的程度.事实上 

J l ^ M [ F n ( A )- F n (-^) + F ( A )- F (-^>)] 
J 3 < M [^\( + cx 3)- F ,( B ) + F (+ co )- F ( B )] 


而按假定有 


UmFAA)=F(A)AimFJB)=F(B) 
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limFrtC —oo) = —oo) ,HmF rt (-hoo) = i^(+oo) 

rt[x; n ■►oo 

故 J '， J 3 可以任意小.再根据定理 5. 2.2,只要《充分大，也可使 
A 任意小，从而证得了定理. 

二、连续性定理 

下面我们将导出一个分布函数列弱收敛到一个极限分布的充 
要条件，这个结果同时说明了存在于分布函数与特征函数之间的 
一一 对应是连续的，这个性质对于特征函数成为研究一些极限定 
理的主要工具有基本的重要性. 

定理 5. 2. 4 (正极限定理） 设分布函数列弱收敛于 
某一分布函数 FU )， 则相应的特征函数列 {/„“）} 收敛于特征函 
数/“)，且在 t 的任一有限区间内收敛是一致的. 

[证明]函数 e 1 “在 一 oo < x < + oo 上有界连续，而 

/„(£)== e u :dF„(x) 

J — OC 

/(0= T e ^ dFix ) 

一 oo 

因此由拓广的海莱第二定理即知当时，有 

至于在 〖的 每一有限区间內收敛的一致性，由拓广的海莱第二定 
理的证明就可看出. 

定理 S . 2. 5 (逆极限定理） 设特征函数列</„ G )} 收敛于 
某一函数/(0,且 / Q ) 在连续，则相应的分布函数列 
{ F n Cx )} 弱收敛于某一分布函数 FCr )， 而且/(0是 FCr ) 的特 

征函数. 

[证明]由海莱第一定理，知必存在子序列 U )} 弱收 
敛于某一非降函数 FU )， 且 FCr ) 可视为左连续的.极限函数 F 
(: c ) 显然满足 八一 ⑺) >0， F (+ oo )< l , 我们来证明 FCr ) 是分布 
函数.否则，应有 
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^^^(+oo)-F(-oo)<i (5. 2. 15) 

任取一正数 e<l — <5 .因 /⑴ 是特征函数列的极限，故 /(0) = 
1. 由于/⑴在 t = 0 是连续的，故可选取充分小的正数 r ， 使 

~ f (t)dt ^>1 — — ( 5 . 2 . 16 ) 

同时选取及 X ，使々>尺时， 

C- w 




又因/%⑴是特征函数，那末 



n Xt)dt 


e iu dt dF nk (x) 

J 一 r _ 


显然 


e ltJ: dt ^2 t 


还有，在 | x |> X 时， 


fck 


sxnrx 


〈臺 


因此 


fnAOdt ]^ 


e itx dt\dF n (x) 


| x|<X 



jr I >X 


e i < J d ^) dF ^(^) 


<2 r & + | 


所以 


fn k (i )d^ + + 


令 是 — oo , 由控制收敛定理知 


，r 

. - 


fCt)dt 


(5. 2. 17) 


(5* 2. 18) 
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这与 （5. 2. IS ) 矛盾，因此 (5. 2. 15) 不成立，也即应有 

F( —°o) = 0,F( + oo) = i 

因而 FCz ) 是分布函数.再由定理 5. 2. 4推知 /( t ) 是 FCr ) 的特征 
函数. 

进而证明也弱收敛于同一分布函数 FU ). 如其不 
然，一定存在 FCr ) 的一个连续点工。使 {& Cr 。）} 不收敛于 F ( xo ). 
这时可从 {A Or 。） 丨中选取一个收敛的子序列(: r 。）}， 其极限 
F * U 0 )^ F ( x 0 ). 根据海莱第一定理，一定可以选取 { F OTi (: r )} 的-一 
个子序列 { F > Cr )} 弱收敛于某一有界的非降函数 F ' Cr )， 这个极 

限 g 数至少在 A 点与 FCr ) 不相等.但重复前面的论证可知 
FU ) 亦应是分布函数，其对应的特征函数也是 /( 山由唯 一性定 
理，我们又有广 Cr )=^ Or >， 引出了矛盾.故弱收敛于 F 
U )， 于是证得定理. 

在逆极限定理中，若保留“特征函数列收敛于某一函 
数 /(/)” 的要求，而把“/⑴在0连续”的要求改成“特征函数列 
{/„(<)} 在包含原点的某一区间中一致收敛于函数 /( O ”, 则定理 
的结论仍然成立.这是因为由一致收敛性及/„0)在原点的连续性 
可以推知 / U ) 在原点的连续性.通常把“特征函数列 {人 (0} 在 
( — oo , oo ) 上的任一有限闭区间中都一致收敛于一个函数 /G)” 

简称为内闭匀敛于/⑴”，这样我们就可以把分布函数列 
{ KU )} 弱收敛于某一分布函数的充要条件简述为 ：它相 应的特 
征函数列 </ n ( n } 内闭匀敛于某一函数 no. 

通常把正逆极限定理合称连续性定理，因为它们表述了分布 
函数与特征函数 一一 对应关系的“连续性”.这定理最先由法国数 
学家莱维 ( Uvy ) 及瑞典数学家克拉默 ( Cran ^ r ) 证得，因此又称菜 
维一克拉默定理. 

三、随机变置的收敛性 

概率论中的极限定理研究的是随机变量序列的某种收敛性, 
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对随机变量收敛性的不同定义将导致不同的极限定理，而随机变 
量的收敛性的确可以有各种不同的定义，现在就来讨论这个问题. 
首先，分布函数弱收敛的讨论启发我们引进如下定义. 

定义 5. 2. 2( 依分布收敛） 设随机变量乂 ( o >) 的分布函 

数分别为 KCr ) 及 FCr )， 如果 F „( x ) 二 FCr ), 则称依分布 

收效 （convergence in distribution ) 于 H < o ) ，并记为 乞 （如) 

其次，由伯努利大数定律，我们很自然地引进下面的定义. 

定义 5. 2. 3( 依概率收敛）如果 

limF{ — j ^e} =0 (5-2-19) 

« — ►to 

对任意的 £>0 成立，则称{匕 O )} 依概率收敛 (convergence in 

probability ) 于 $( to ) ，并记为 匕 （ w ) 二芒 ( w ). 

这样一来，伯努利大数定律可以重新叙述 如下： 

设 •是 n 次独立试验中事件 A 出现的次数，而/>是事件 A 

在每次试验中出现的概率，则频率$依概率收敛于概率 />. 

上述 两种收 敛性之间的关系可以从下面定理中看到,这也说 
明了随机变量序列依概率收敛性的重要性. 

定理 5. 2. 6 乞 二- 

[证明]因为，对 VO 有 

{芒0’ } = } 4- } 

CI { 彡 "0) } 

所以我们有 

如果 依概率收敛 于匕则 

P{^„^X ^<C.x' }^P{ }~**0 

因而有 

FC^Xlim^Cx) 

"4 CO 

同理可证，对: T "> x ，成立 


« 
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所以对 ^<Cr<Cr"， 有 

Fix' )^\\mF ^ U)^\mlF n ^J ： )^F^x ,, ) 

n"-*oo rt—oo 

如果: r 是 FGr) 的连续点，则令^，: r" 趋于 x 可得 


Fix) =limF„(j!：) 

«--► oo 

定理证毕. 

由于不同的随机变量可以对应于同一分布函数，因此一般地 
讲，由分布函数列的收敛性当然推不出随机变量序列的其他收敛 
性.试看下例. 

[例 3] 若样本空间 <0=彳出】 ， W 2 }，/*(>〗）=尸 (0> 2 ) 定义 

随机变量 f ( W ) 如下: — 1 ， f ( w 2 ) = l ，则的分布列为 






(5. 2. 20) 


若对一切〜 令乞 U ) = - $( w ), 显然夂 （ w ) 的分布列也是 
(5. 2. 20) ,因此 $ n M ~^ Hco ). 但是对任意的 0<e<2， 

P{ | ^ n (cu) — $(co) j >e} —P{0}=^ 1 


因此不依概率收敛于 fb), 这为定理 5. 2. 6之逆提供了 
反例. 

进一步，若令 $2 nM =$ M ，$ 2 „ +1 0) = — 则 $ n (0))-^^ ( U )) 
依然成立，但此时对随机变量序列{己 (0>M 实在很难有其他的收敛 
性可言 • 

但是， 在特殊场合却有下面结果. 

定理 5. 2. 7 设 C 是常数 ，则乞 二 C ㈡乞 上 a 
[证 明]由定理 5. 2. 6可知只须证明由依分布收敛于常数可 
推出依概率收敛于常数.事实上，对任意的 e>0, 

尸{|乞一(:|>0二尸氐 > C + e }+ 尸 e } 

-l-F n (C+e)+/ , „(C-£+0) 
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—1 — 1 + 0 = () 

( w ->oo) 

因为有的大数定律是讨论随机变量序列收敛于常数的，这时将用 
到上述结果. 

仔细考察上节关于大数定律的证明，有助于理解下面关于随 
机变量收敛性的第三种定义. 

定义 S . 2. 4( r 阶收敛）设对随机变量乞及 S 有五 |匕 卜<⑺， 
E \^\ r < C °° » 其中 r >0 为常数，如果 

lim £ — ^| r — 0 (5.2.21) 

n 

则称 { 己 } /■ 阶收敛 (convergence in reorder m « wi ) 于 $，并记为 

下面定理揭示了 r 阶收敛与依概率收敛的关系. 

定理 5. 2 . 8 e„ 

[证明]先证对于任意 e >0, 成立 

P { I ^ (5.2.22) 

t 

事实上，若以 F ( x ) 记乞 一$ 的分布函数，则仿车贝晓夫不等 
式的证明可得 

P { |6„ — ^ |> e }=, i ^^ dFCx ) 

* 

《 ixi > e -^ r - dF ( x )^~ | x | r dF ( x ) 

C C J ~ oo 

二 £|Ul r 

— €T 

不等式 (5. 2. 22) 是车贝晓夫不等式的推广，通常称作马尔可 
夫不等式，当 r ==2 时就是车贝晓夫不 等式. 定理 5. 2. 8是马尔可 
夫不等式的直接推论. 

下例说明定理 5. 2. 8之逆不真. 

[例 4] 取 n =( o ， i ]，^ 为(0，1]中博雷尔点集全体所构成 
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的 <r 域 , P 为勒贝格测度 * 定义 Rco) 三 Q 及 

n Ur ,0< co ^ — 

$ n (a)) ( 5 . 2 . 23 ) 

0 ， — 

I n 

显然对一切⑴ e 仏 如）， 又对于任意的 €> o ， 

P{ I ] ^e}^— 

n 

因此 & 但是 

E \ t -^ Y = in l/r y • 丄 =1 

n 

在 r 阶收敛中，最重要的是 r = 2 的情况，这时称为均方收敛. 
下 面是关于随机变量收敛性的第四种定义. 

定义 5. 2. 5( 以槪率1收敛）如果 

F { lim ^ n ( a *)— f ( a ))} = 1 (5* 2 - 24) 

则称{氕(如）}以概率 1 (convergence in probability 1>收致于 f (如）， 

又称 { 6(如) } 几乎处处收敛于芒(如），记为乞 

以概率1收敛是概率论中较强的一种收敛性，但是正如例4 
所表明的，一般并不能由它推出 r 阶收敛.关于以概率1收敛的讨 
论将在§ 4中继续进行，在那里将证明可由以概率1收敛推出依 
概率收敛. 

•四、 波 j # 纳尔 ( Bochner )— 辛钦 ( Xmhhhh ) 定理 

利用这个机会，我们来叙述并证明一个关于特征函数的重要 
定理. 

定理 5. 2. 9( 波#纳尔一辛钦）函数 / U ) 是特征函数的充要 

条 件是: /⑴非负定，连续，且/(0) = 1. 

在证明的过程中，顺带证明了一个在随机过程中将用到的与 
上述定理类似的赫尔格洛兹 ( Herglotz ) 定理.为此，有 
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定义 5. 2. 6 如果对任意的正整数 n 及复数 A ，々，•••，<均有 


n n 

XI (5.2.25) 

k -- 1 1 

则称复数列 C „(» = G ，±1，±2, …）是非负定的. 

定理 5. 2. 10( 赫尔格洛兹）数列 C a (n = 0, 士1，±2,…）可以 

表为 

C n = f e inx dGU ) (5.2.26) 

J ~ 1 t 

的充要条件是它是非负定的，其中 G (: r ) 是[― 7 T ，7 r ] 上有界、非降、 
左连续函数. 

定理 5. 2. 9的必要性已在第四章§ 5中证过，定理 5. 2. 10也 
可类似证明，下面只须证明充分性. 

由于 /(() 是非负定的，故对任何 iV , 实数 A 及复数 = 

n 

0，1，…，1)，皆有 

N-\ N-1 

= 2 S/f e ™ K H ) X ) 

Jy k=^ \ n 

易知，其中使 k ~ j 等于 r 的项有 N ~ | r | 个, r 可由 _ iV + l 变到 
N —\. 因此 

r =^z — n \ ly j ^ Tt I 

从而 



所以 



參 
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1C 


e 1 ， 公 )(x)dr 

= e ^ dFi n > ( x ) 

J - w 

其中 

n n) (x> = ^-f x ^(odt 

-n 

是一个在 [一 k , x ] 上有界的非降函数，其全变差为 

作)⑷= ‘r 列〉(触=/(0)=1 

u^J —* 

补充定义1<—兀时/^)(文）= 0，工>兀时，/^0：) = 1,则/^(工) 

是一分布函数. 

按海莱第一定理，存在序列 — QO 时从 — 00, 使函数序 

列 n ；( x ) 弱收敛于某一非降函数 F M ( x ). 又因对任何 W 及 e > 

0 , 



Fi- y ( — tt — e) = 0 ， F^°(/r + e) 


因而也有 


F 


M 


k — t) = 0^ F <n )(7r + e) 


所以 F (ft) ( x ) 也是分布函数. 
按海莱第二定理， 

lim f e'^dF^ (x) 


广冗 








e isx dF M M 


n 


所以，对一切整数 y 0 = 0，士1，±2, 


# * # 


) 有 



' 5、 


n 


■B 


e 似 dF( n> ( 工） 


— x 


至此我们已顺便证明了赫尔格洛兹定理.特别地 


rt 



n 




e ix dF M (x) 


K 


考虑特征函数序列 


fnH ) 


rrtn 


e ^ dF n M 




(5 - 2. 27) 


參 
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其中 F n ( x )= F M [-\. 易知对一切整数々有 

n 

k { k 

f n — = f \ — (5. 2. 28) 

n \ n I 

对任何 G 我们总能选取序列& =々014)，使 — 丄.由于 

n n 

/⑴连续，从而 

fit ) = lim /( —) = lira / n (— I (5.2.29) 

rt-^oo y Tl J «-*oo \ Tl I 

如能证明对一切实数 G 有 

fit ) = lim /”(,） （5. 2. 30) 

那么由逆极限定理即知/⑴是特征函数了. 

为此，由 （5. 2. 28) 和 （5. 2. 29) 有 

lim/„ (0 = lim | /" ⑴一 /«( — + /” — I 

«-*oo [ l \ ^ / J \ n }] 

— fit ) H ~ lira f n ( t ) — /„ — (5. 2. 31) 

Jf 一 QO L \ 行 / 胃 

令^丈一去，那末■•按人⑴的定义，有 

广 t fl 

h Cnn 

fnit ) - fn — = e ia / flU ( e ^ - l ) dF fl U ) 

\ 打 / d — it* 

< | e & — HdF . Cx ) (5. 2. 32) 

J 一 rtH 


利用施瓦茨不等式，可得 

nn 

I e itfx — 1 |dF rt (x) < 

一 nn 

nfc 

2(1 — cosdx ) dF n Cjc ) 

—狀 - 

= [2(1 - Re/„(<9))]i (5. 2.33) 

其中 Re /„ (幻 为人 0?) 的实数部分.既然在0<«<1及一兀<^<兀 
B 寸有 cosjy ^ cosajy ， 则 
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'nw 

1 -Re/ fl (^) = , ^ n M—cosdx)dF n (x) 


— 武 （1 — cos^i/d 凡（町 XJ ^ lt (l—cosy)dF n (ny) 


—J 一 i(l --cos^OdLF ⑻ (jy) 

'K 

=1 —Rej__«eMF ⑷ （: y) 

再由 （5. 2. 27) 我们得到 

1 — Re / n (^) ^ 1 — Re /^ — (5* 2* 34) 

n 

合并 (5. 2, 31),(5. 2. 32)， （5. 2. 33)，即得 


Lit) - fn 


k _ 

n 




注意到/(0) = 1，则由 /( G 的连续性推得 


lim f n (t) — f n 


!k 

；n 



于是由 （5. 2. 31) 知 (5. 2. 30) 成立，定理证毕 • 

若不证赫尔格洛兹定理而直接证波赫纳尔一辛钦定理，有比 


较简练的证法，可参看 C . R . Rao，Linear Statistical Inference and 
its Applications,second edition , pp . 141 一 142. 


§3. 独立同分布场合的极限定理 


一、 独立和问题 

在§ 1中，我们讨论了伯努利试验场合事件 A 出现次数&的 
极限行为，曾指出 A 可以表示为《个独立随机变量之和（以后简 
称“独立和”），并对它证明了大数定律及中心极限定理，后来又看 
到这些定理有重要 应用, 这里自然会提出这样一个问题:这些性质 
是否只在伯努利试验场合才具有？ 


擎 
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研究表明，许多独立和具有类似的性质，本节就要迸一步讨论 
这个问题. 

独立和的问题经常出现 t 例如测量一物体的某种尺寸，如测量 
-个圆柱体的直径 A 通常采用的办法是对它进行 n 次测量，得到 
数值 u 2 ，… ，乞 ，然后采用平均值 



作为 d 的数值 * 我们知道，测量时有各种随机因素影响，因此其结 
果带有随机性，这时7«是随机变量之和，如果各次测量是独立的, 
Vn 便是独立和.为了说明上面所用办法的合理性就必须研究独立 
和.但这 里的乞 不服从伯努利分布，因此已不是伯努利试验 
场合的问题了. 

在数理统计中已经把上述做法一 般化. 为了研究母体(它通常 
描述我们感兴趣的某一类现象)的某些特征，就对母体进行若干次 
观察以得到一批观察值 U 2 , …，乞，并称它们是一个容量为 n 的 
子样.再利用这个子样来构造各种统计量，例如 



6十巧+…+ e 

n 


以对母体的特征作各种推断.虽然每次观察得到的是具体的数值， 
但是为了比较各个统计量或各种推断方法的优劣，有必要把这些 
观察看作是某随机变量 e 的观察值，通常假定是相互 
独立的，且它们与$具有相同的概率分布，这时上面的两个统计量 

便都是独立同分布 (independent and identically distribution ) 的随 

机变量之和. 

独立和的问题在许多实际问题中也出现，例如在计算电车整 
流站的电力负荷时，就遇到独立和问题，因为整流站的电力负荷等 
于各电车使用电力之和，每辆电车在某时刻的用电量是随机的，作 
为初步近似，可以假定各电车的用电量是相互独立的，因此这里遇 
到的正是独立和.在车间用电问题中，若有多类车床，用电量各不 
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相同，则总用电量也需通过独立和来计算. 

可见独立和问题经常遇到，而且各加项一般都不是0— 1分 
布.本节专门讨论各个加项服从相同分布的场合，这是实际工作 
(特别是在数理统计）中最常碰到的.从数学方面来看，这是最简 
单、最基本、最便于处理的，而且所用的处理方法可以相当方便地 
运用到更一般的场合. 

在上章§ 5 中，我们讨论过独立的服从同类型分布的随机变 
量之和的分布问题，证明了某些分布的再生性，使用的工具是特征 
函数.现在我们要处理的问题与那里有很大区别，首先我们将对很 
一般的分布进行讨论，因而再生性通常都不满足;其次，不是对固 
定的 n 进行讨论，而是讨论 n — 〜时 的情况，即研究极限定理.从 
数学的角度来看，它们可以看作是伯努利试验场合极限定理的推 
广，这里也研究大数定律与中心极限定理. 

所使用的工具还是特征函数.我们已经看到它很适合于处理 
独立和问题，有了上节的连续性定理，我们将进一步看到，它也很 
适合于处理极限分布问题.事实上，正是由于特征函数这一有力工 
具的使用，使得所有古典极限定理在短期内便得到了完满的解决. 
拉普拉斯就已经知道并应用了特征函数，俄国数学家李雅普诺夫 
( Jhn yH 0 B ) 最先发现并证明了收敛于正态分布的连续性定理(但并 
未明确叙述），从那时起，特征函数的理论不断得到完善.在这当 
中，法国数学家莱维有突出的贡献.现在，特征函数法已经成7■概 
率论的基本方法之一. 

二、辛钦大数定律 

在§ 1中，我们已经通过车贝晓夫不等式建立起多种大数定 
律，那里都假定了方差的存在性，但是在独立同分布场合,并不需 
要有这个要求，这就是有名的辛钦大数定律告诉我们的.用特征函 
数作为工具，这个定理很容易证明. 

定理 5.3.1( 辛钦） 设$，匕，…，己 ，… 是相互独立的随机变 
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量序列，它们服从相同的分布，且具有有限的数学期望 


E^ n 


则对任意的£>0,有 


limP 


n 




< 


(5. 3* 1) 


[证明]由于 H ， …，乞具有相同分布，故有同一特征函 
数，设为 / G )， 因为数学期望存在，故 / G ) 可展开成 


/⑴=/(0)十 /’ (0)^ 



(/) = !+ iat + o(t) 


(5. 3 . 2 ) 


而的特征函数为 


/ 




1 + i “ 





(5-4. 3) 


对于固定的 





(n 


极限函数#是连续函数，它是退化分布 /( 


( 5 . 3 . 4 ) 


) 所对应的特征 


n 


函数，由逆极限定理知的分布函数弱收敛于再由 


定理 5. 2. 7 知丄 依概率收敛于常数 W 从而证明了定理. 

n 1=1 

显然，伯努利大数定律是辛钦大数定律的特殊情况.辛钦大数 
定律在应用中很重要，下面通过一个例子来说明. 


[例 1] (用蒙特卡洛方法计算定积分)为计算积分 


J 


可以通过下面概率论方法实现. 


g(jo)d 


( 5 . 3 - 5 ) 


任取一列相互独立的、都具有[〜幻中均匀分布的随机变量 
灰}，则也是一列相互独立相同分布的随机变量，而且 


EgO 


h —— a 


g(x)djc 


b — a 


( 5 . 3 * 6 ) 
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既然 

J — ib ~ a ) • Eg ( f t ) 

因此只要能求得五^^夂便能得到^；的数值. 
为求以(彡,），自然想到大数定律，因为 

发（芒 1) 十 gd ) + ’"+ 发（芒”） 


(5.3.7) 


(5.3. 8) 


这样一来，只要能生成随机变量序列 { g (6)} 就能对积分 （5. 3. 5) 
进行数值计算，而生成的关键是要生成相互独立相同分布 
的 R } ，这里的6均服从1> ，幻 上均匀分布. 

现在已经可以把上述想法变成现实.这就是在电子计算机上 
产生服从均勻分布 [ a ，6]的随机数 { f ,} 并利用 （5. 3. 7)(5. 3. 8) 估 
算这种做法与我们在蒲丰投针问题中通过投针计算圆周率兀 
的做法是一致的.这种通过概率论的想法构造模型从而实现数值 
计算的方法，随着电子计算机的发展，已形成一种新的计算方法 
——概率计算方法，亦称蒙特卡洛方法，它在原子物理、公用事业 
理论中发挥了不少作用，这个方法的理论根据之一就是大数定律. 

至于计算积分，蒙特卡洛方法的实用场合是计算重积分 


I =\ giP)dP (5.3.9) 

其中尸是 w 维空间的点，当 w 较大时，用蒙特卡洛方法比一般数 
值法有优点，主要是它的误差与维数 m 无关. 


三、中心极限定理 

我们转而考虑如何把积分极限定理推广到相互独立相同分 
布，但分布函数为任意的随机变量序列的场合，这类问题在实际应 
用中非常重要. 

若心 ，匕…是一串相互独立相同分布的随机变量序 
列，且 

E^ k = m,D^ k = a 2 (5. 3. 10) 
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我们来讨论标准化随机变量和 

1 n 

Kn= -^ XI ^k — m) (5. 3. 11) 

(7 V n k^i 


的极限分布. 

林德贝格 ( Limleberg ) 与莱维建立了下列中心极限定理. 

定理 5. 3. 2( 林德贝格一莱维） 对于标准化和 （5. 3. 11)， 若0 

O 2 < oo , 则 


limP{^<lx} = - e f /2 dt (5.3.12) 

” 一。 v ^ 2 兀 」 ） 


[证明] i 己 m 的特征函数为 〆 )0，则^的特征函数为 


mm 

\ t \ 

■ 

? 

/ 



\ c V n ) 



因此 


由于五乞= w 故 ^(0) = oy (0) = 



所以 


^pCt ) = 1 — ^-<j 2 t 2 + o{t 2 ) ( 5 . 3 - 13 ) 




—► e 



2 


(5* 3. 14) 

由于 e ^ /2 是连续函数，它对应的分布函数为 AK 0，1), 因此由逆极 
限定理知 

尸 e ~ t?/2 dt 

v 


定理证毕. 

用这个定理立即可以推出棣莫弗一拉普拉斯积分极限定理. 
林德贝格一莱维定理有广泛应用.在实际工作中，只要《足够 
大，便可以把独立同分布的随机变量之和当作是正态变量.这种做 
法在数理统计中用得很普遍，当处理大子样(容量很大的子样)时， 
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林德贝格--莱维定理是重要工具. 

下面我们 介绍另 外的两个例子. 

[例 2] (正态随机数的产生）在蒙特卡洛方法中经常需要 
产生服从正态分布的随机数，但是一般计算机只备有产生[0，1]均 
匀分布随机数(实际上是伪随机数)的程序.怎样通过[0，1]均勻分 

布的随机数来产生正态随机数呢?这有多种途径，最常用的是利用 
上述定理来实现. 

设…是相互独立、均服从[0，1]均匀分布的随机 
变量，这时定理 5 . 3 . 2的条件得到满足，故匕+ 6 +…+ 乞 渐近于 
正态变量.一般《取不太大的值就可满足实际要求.图28中给出 
了《 = 1，2,3时的图象.在蒙特卡洛方法中，一般取《 = 12,并用 
(5.3. 15) 式得到新的随机数序列. 

户山）—1, 0 ^ x < 1 

{ 0 ^ < 1 
K 2 ~ x A x <C 2 



O 1 2 3 ^ 


图 28 均匀分布褶积 

12 

12 (A 1) + 1 _ 6，々=1，2,… （5. 3_ 15) 

7 ^ 1 
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显然 冰丨 也是独立随机数序列，而且 Erj k =0, Drj k = \. 经过检 
验证明，这时％的渐近正态性已能满足一般精度要求. 

[例 3] (近似数定点运算的误差分析）数值计算时，任何 
数 x 都只能用一定位数的有限小数^来近似，这就产生了一个误 
差芒= 2 — 3 N 在下面讨论中，我们假定参加运算的数都用十进制定 
点表示，每个数都用四舍五入的方法取到小数点后五位，这时相应 
的舍入误差可以看作是 [ — 0. 5 X 10- s ，0. 5 X 10_ 5 )上的均匀分布. 

现在如果要求 n 个数 1(/== 1,2,…，; 2) 的和5,在数值 计算中 
就只能求出相应的有限位小数 _ y , G=l ,2,… ， n ) 的和: T , 并用 r 作 
为 S 的近似值.自然要问，这样做造成的误差 rj ^ S - T 是多少？ 
因为我们有 

S ^ = + = 2 ^. + 2 ^ 

i— 1 / — 1 r — 1 

故 


1 = 1 

一种传统的估计方法是这样 的：由 于 


所以 


^ | < 0. 5 X 10— 5 


\v\ < 2 1^1 X 5 X 10— 5 

I ™ 1 

以« = 10000为例，所得的误差估计为 

\v\ < 0.05 (5-3.16) 

这种估计方法显然太保守，看来用概率论方法估计是适宜的. 

n 

这时直接求7= 2^的分布不容易，但当较大时用极限定理作 

1=1 

为工具，则能使问题很快得到解决.因为 



如果假定舍入误差 f 是相互独立的，〃又较大，那么用定理 5. 3. 2 
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得到 


n 


p { XI 乏 < 是 1 


_A 


/ 


\/2 n 


2 dt 


k 


取是 = 3 时，上式右边为 0. 997, 因此我们能以 99. 7% 的概率断言 


|?! < 3 X 100 X 


(X 5 X 10 
/3 T 


— 5 


0. 866 X 10 


— 3 


(5. 3.17) 

这只及 (5. 3. 16) 式中上限估计的60分之一. 

历史上，误差分析是概率论的重要生长点之一 . 19世纪初德 
国数学家高斯 ( Gauss ) 正是在研究测量误差时引进了正态分布并 
发展了有广泛应用的最小二乘法.至今这仍是概率论与生产实际 
有广泛联系的领域之一.由于高斯对正态分布的研究，因此有不少 
人称正态分布为高 斯分布 (虽然棣莫弗及拉普拉斯早在高斯之前 
就把正态分布引入概率论). 

下面我们把中心极限定理推广到多变量的场合. 

* 定理 5. 3. 3( 多元中心极限定理） 若/>维随机向量&，&， 
…，…相互独立，具有相同的分布，其数学期望为〜协方差 
阵为2，则 

n” = {(fi— ") 十 （$2 — P)+ …+ (&—M)}/ v^T (5. 3* 18) 

的极限分布为 w ( o ， r ). 

[证明]对/>维列向量 L 构造 


G = (5. 3. 19) 

v n 

它是均值为0,方差为 A IA 的一维随机变量，由定理 5. 3. 2知它 
的分布函数收敛于 N(0，；VSO, 因此，若以/«⑴记 G 的特征函 
数，则 

fn(t)^f(tf^)=exp( — ^ f IAt 2 /2) (n—oo) (5* 3. 20> 


而 


/„(/) =£e ,r? " {expdtXr] n ) } 
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因而 

/„ ( 1 ) ^ Ee'^ n == E { exp ( i /)} 

它作为 A 的函数，是％的特征函数.在 （5. 3. 20) 式中，令 /= 1，得 
到 

f„( \)—/"(! »^)=exp( _ X 2) ( 5 • 3 . 21) 

这正是/>维正态分布 iv ( o ， r ) 的特征函数.因此由多维的连续性 
定理即得结论. 

[例 4] 服从 (3. 2. 6) 中多项分布的随机向量，可以看作”个 
相互独立相同分布随机向量之和，由定理 5. 3. 3可知多项分布渐 
近于正态分布，真正维数为 r —1. 

*§ 4. 强大数定律 

一 、 以概率1收敛 

以前，我们曾顺便提起过以概率1收敛及强大数定律,本节将 
对它们进行深入讨论. 

要彻底搞清以概率1收敛这个概念，必须对事件(点集)序列 
的运算有进一步了解，我们就从讨论这个问题开始. 

设儿， …， A ， …是一列事件，则0儿表示事件序列 ▲， 
Ah 1，…中 至少发生一个，而 H A 则表示…同时发生. 

n = k 

记 

Y \ mA n = f ] 0 A (5* 4* 1) 

rt — ►oc k= k 

\ imA n = U H 在 i (5. 4* 2) 

ft -^oo ^ * 1^ ~ ^ 

称 ksa 为事件序列 {八} 的上 限事件 ，它 表示凡 发生无穷多次， 

” 一 * OG 

因为 we n ua 当且仅当 ~属于无穷多个九;类似地称_ 凡为 

1 ji — i 

事件序列 MJ 的下限事件 ，它表示儿至多只有有限个不发生，因 
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£.X 


为 ⑴ 6 u n 儿，当且仅当存在一个 w ， 使 riA, ， 因此若⑴发 

k=\n = k n — N 

生，则 Av,Av.h ， … 同时发生，这时至多只有前面 N ~\ 个事件 
.4,,^, … ，可能不发生 ( 也可能有些发生 ). 

显然 

lim 凡〕 lim A” (5. 4. 3) 

ft c x ' 77 - 舞 OO 

特别当 lim A = lim A 时，记 lim 凡 slim A = limA n , 并称它为事件 

n n -*co n-^ "jo n _^ K , 

序列 {/U 的极限事件 . 

利用德莫根定理，有 

f ：XJ CX.' \ DO OO 

n u 丄 =u nx 

t k=ln=k I A= U = A 

f ->0 Of \ O 。 a ： JO _ 

u n^n = c\ Cm” 

^ A — ]« — t / k— ln — k 

因此 

— ■_\ 

\imA n (5* 4 - 4) 


lim A n — \ lim^ (5. 4. 5) 

« * :VJ \ n + oo / 

下面博雷尔一康特立 (Cantelli) 引理在概率论中有众多的应 

用 . 

引理 5. 4. 1( 博雷尔一康特立引理） 

G) 若随机事件序列 {A >} 满足 

DO 

SfUJ <^ (5.4. 6) 

n—\ 

则 

P\lim/l rt } = 0^ P{]imA n } — 1 (5.4.7) 

/! 一 fl—►OO 

(ii) 若是相互独立的随机事件序列，则 



(5.4. 8) 
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成立的充要条件为 


P{\imA n } = 1 或 P{limyl n } = 0 


(5.4*9) 


[ 证明 ] ( 1 ) 由于 


P{\imA n } —P \ p| U } 




< ： P{{JA n }^J]P{A n }^0 


(是 4 00) 


由 （ 5 - 4 . 4 ) 


P{limAJ = l 


(ii) 先证必要性 • 注意到 { 人 } 的独立性，有 

oo 

P{\imA n } = P{l) nx}<Sp{fiAj 


oo 


S TXp(^ 4«) = S IT [l — P(A„)Ji 


( 5 . 4 . 10 ) 


由于 


0^1 —P(A n )^exp{—P( A n )} 


则从 


2 尸 ( 儿 ) = 


可得 


nci — 尸 (A) Klim exp { — } =0 


所以 


P { lim > l „} = 0 


再证充分性 • 若尸 = 1 • 假定乏 ] PC^Xoo, 则由 （ i ) 得 

ft — ^oo 女 


到疋卜 0 , 产生矛盾 • 因尸 ( 戌） > 0 , 故只可能是 2 ] 尸 ( 疋 ) 

，引理 证毕 . ” _1 

现在讨论随机变量序列的以概率 1 收敛性 . 
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若 6(00(^ = 1，2，〜），以00是随机变量，则 

{⑴： lim ^ (⑴）=彡0) } 

( CJO Oc OO I *1 \ \ 

co ： n u n I 乞 (⑴）一彡(出） i <— I ( 5 * 4 . 11 ) 

w i« —^\ fTl I J 

这个式子可以这样 理解: 因为⑺ G {\ imU < o ) =$ M ) 的充要条件 是:对 

A—►CO 

任一正雖衍，存在一个正整数 N ， 使当 n > N 时均有 | 乞(仞 ) -eMl 
〈丄；即对任一正整数 m，to 属于 ( j ^ n (< o )—$(( o ) |<C— 的下限事件， 

m \ m 

这正是 (5. 4.11) 的右边.从这个表达式中还可以看出， 

p)'-*00 

f ( o >)} 是事件，因此 

P{\im^ n {o)) = ${<o) } = 1 ( 5 . 4 . 12 ) 

n-^oo 

有明确的意义，这时称以概串1收敛于 ew . 记为乞 ( o ») 

a* s* - 

- ^(< w ). 

因此下面两个式子都表达了 {匕 ㈦ ) } 以概率1收敛于 $ M . 

( OO OO / 1 V \ 

n u n 1^>)—^>)1 <丄 (5.4.13) 

m = In —A \ f j 

p ( 0 n uf Ito ) — 尽(出)|>丄1 1 = 0 (5. 4-14) 

I m= 1^ = \n^k \ 1ft f J 

进一步，我们要说明，匕⑹}以概率 i 收敛于的定义也 
可以表达为:对任意的 e >0, 成立 

Pi U ( 1^(^) — f(^>) |^€/ =0 (5 - 4. 15) 

\ k= ln = A j 

若以戌 记 （HOo) — H ⑴ ）|>e ) ，上式表示的概率为0,这与 

H—OO 

我们对以概率1收敛的理解一致.不过，对于这个结论，还是给它 
一个严格的证明. 

事实上，由于对£>0,总有 

j H 0 ( 1^(^)—^(< w ) l ^ e )) 

I k= ln^ k J 

( O.j OO CO I 1 V \ 

u 门 u \ e n M - ea < o )\^ 

m= 1A— ln = A \ f7Z j J 


* 
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因此由 （5. 4.14) 可以推得 (5. 4. 15). 反之，利用 

( OO 00 :I 1 \ \ 

U 门 U K (⑴)一多 ㈤ 去 

m-- \ k = ln = ky / j 

<2 p ( nu [ i ^)-^) i^)i 

ffl = 1 ( A ~ 1 ^ ^ j j 

可由 （5. 4. 15) 推出 （5. 4.14), 这就说明了两舞表达法的等价性. 

利用概率的连续性可知， （5. 4. 15) 等价于 

iimpl Cl(|0)- 芒 (oi)|>e> 卜0 (5.4.16) 

^-►oo ( n = k j 

根据德莫根定理又知 （5. 4. 15) 等价于 

limpl 鬥（比⑻― S ⑻ |<£)}=1 (5- 4. 17) 

Jfe-^oo \ n = k J 

由于 

{ \^ k (<o) — $(co) |^e}d( U (| 彡》 _ 竽 ( 似 ) ) 


因此若 (5.4, 16) 成立，则 

limF{ j ^e} = 0 

是 —oo 

这样一来，我们已证得 

定理 5. 4. 1 

下例说明一般不能由依概率收敛推得以概率1收敛，所以以 


概率1收敛是比依概率收敛更强的一种收敛性 • 


[例 1] 取 D=(o,i]，y 为(0，1]中博雷尔点集全体所构成 
的 J 域， P 为勒贝格测度，令I 


VkiM=i 


1 ， 

1 i — 1 t 

、 k ， k\ 

0 ， co ^： 

1 i-l i 1 
^ k ^k\ 


t = l ，2,…，是 

(5. 4. 18) 

k= 1 ， 2，… 


定义 


60) = 711 (出） ， f 2 (=721( 出），尽 3( 切 ） =VzzM 
芒 4 (如）=731(如），1(如） = 732(出）广* 
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一般 Kw ) = %, (< w ) ，其中 n = i -\~- ^- 1^，这样定义的彳 } 是 

一 列随机变量.但对于任何一个 we ( o , i ： u „ o )) 必有无限个々，; 
使其取值0,也有无限个使其取值1，因此 { KoO } 不是以概率 
1收敛于 0. 但是另一方面，对任意的00， 

p{ I% ( 仞 ) I 士 

当 Ti — >00时，由”= 々(々 2 D + 2 1) +々，知道是—°°，因此 

lim_P{ |^„(a>) I 

n 一 ►do 

=limF { I rj kl (co) | } = 0 

n 一 oo 

所以 A ( aO } 依概率收敛于 0. 

不难验证， {«^ U )} 是 r 阶收敛于0的，因此例1也 1| 供了 r 阶 
收敛推不出以概率1收敛之例. 

我们以前讨论的大数定律只要求依概率收敛， 若把收 敛性要 
求 提高为 以概率1收敛，则得到的大数定律称 为强大数定律 

(strong law of large numbers ). 由定理 1 可知，若强大数定律成 

立，则通常的大数定律也一定成立，反之不然.有时为区别起见，把 
依概率收敛意义下的大数定律称 为弱大数定律 (weak law of 

large numbers). 

第一个强大数定律是由博雷尔在 1909 年对伯努利试验场合 
建立的. 

二、博雷尔强大撖定律 

定理 S . 4. 2 (博雷尔） 设是事件在《次独立试验中的 
出现次数，在每次试验中事件 Z 出现的概率均为 P ， 那么当 
时， 

/»} = 1 (5.4.19) 

[证明]为使 （5.4.19) 成立，由 （5.4.15) 知，只须对任 

• 299 • 



意的 e > 0 ， 成立 

/>( nO ( ^-P > e ])=0 (5.4.20) 

[it—= Tt I J 

若记凡 ^~P >|，则上式可写成尸{1^儿}=0,根据博雷 

[ 71 I tt-^oo 

尔一康特立引理，为证明 （5.4.20) 只要能证明级数 

Cx: I 

!>{ 7 -久 > e | (5. 4. 21) 

n=\ ^ ) 

对任何£> 0 都收敛就可以了. 

假如象证明伯努利大数定律那样用车贝晓夫不等式进行估 
计，只能得到 

尸 il ^ H # (5 . 4 . 22 ) 

这对证明弱大数定律足够了，但为了保证 （5.4.21) 收敛还不行， 
这时必须寻找更好的估计式.在这种特殊场合，马尔可夫不等式 
就够用了.由于 

P {\^~P 4 C 5.4.23) 


问题是要计算&的四阶中心矩.还是象过去一样，我们把 〜表示 

n 

成独立伯努利 0 - 1 变量之和，这样 


n 




所以 


E 


n n n n 


tSSS 


k 


注意到各 6 的独立性及五 dp ) = 0 ,因此上面的和式中只有 
E HpYRE il - p) z ( h -/>) 2 的项才不等于0,显然 


E pY = pq (/ > 3 + g 3 ) (5*4.24) 


E p ) 2 —/>) 2 = p 2 q 2 U 參 j ) (5* 4 - 25) 


« 
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(5.4.24) 形式的项有项， （5.4.25) 形式的项有 


3 n (n —1) 项，因此 


E 




P 


4 


pq 


(p 3 ~\'Q i )^~3pq( 


)] < 


4 n 


(5.4.26) 


于是 


p 




P 


< 


4 eV 


(5.4. 27) 


这个估计式已经比. （5.4.22) 进了一大步，它可以保证 
(5.4.21) 收敛，从而证明了定理. 

从本书第一节介绍随机事件频率稳定性时，我们就期待着这 
样一个结论，即当试验次数无限增加时，频率将趋于概率，博雷 
尔强大数定律正给出了这个结果.从伯努利大数定律并不能引伸 


出这个结论，它只断言一个不等式 




P 


< e 成立的概率可以大 


于1 一 7,不论7 是什么正数；但是事件 


"枝+1 

n+ 1 


P 




^+2 


P 




fhn 

2 n 


P 




中至少有一个发生仍是可能的，因为它是可列个事件之并，而我 
们只知道每个事件的概率很小.但博雷尔强大数定律则断言 


Mn 


P 


以概率1变得很小，而且保持很小.虽然从逻辑上讲，在 


投硬币时每次都出现正面是可能的， 这时& =1 ，因而并不 

n n 

成立，但是强大数定律断言了这种事件发生的概率为 0. 

三、科尔莫戈罗夫强大数定律 

下面讨论更一般的强大数定律，先把其含义进一步明确 如下: 


设{彡,}是独立随机变量序列，若 


P ( lim — 2 — E ^ i ) = 0 ] = 1 


(5.4.28) 


I = I 


麵 
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则称它满足强大数定律. 


根据（5_4.16)，这等价于要求对任意 e >0 成立 

丄史 )=0 (5*4- 29) 

[j^rn\ J i=l j 

由于 

； 

E - 

i= 1 

Cl (sup \ V] (^ t — £6；) ^ e) (5.4.30) 

J ~7 J 

因此需要对概率 pIsu P 1 4 1 进行估计，这相当 

i J / — J I ) 

于在独立和场合对车贝晓夫不等式进行推广.这方面已经有不少 
成果，在这里我们介绍一个由噶依克 （ Hajek ) 及瑞尼 （ F ^ riyi ) 证 

明的不等式. 

噶 依克一瑞尼不等式若沒}是独立随机变量序列， m = 
W < co ， 0 = 1, 2,…），而 { CJ 是一列正的非增常数序列，则 
对任意正整数 w ， 《 ( m < Cn ) 及 e 〉0， 均有 

p{ maxC/ 5] — £|,) 

I ，、丨 

4- S c m ) 

1 j - : m + 1 

[证明]记 

k 

s k ^ y^j (^> — e ^ j ) 

j^i 

及 

n 1 

1= ^SKCl-Cl,,) + CISl 

k — m 

因此 

n rt - 1 

v = s SZ ^ - 

k^m k= m 


( 5 . 4 . 31 ) 


( 5 . 4 . 32 ) 




» 
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利用 } 的独立性 


n 


= SICI^ S (Sl-su^a 

k l 


Es z k = y 

尸 i 

所以有 

m n 

Ev = Cl ^ a ) i - 2 C ? a ) (5.4. 33) 

j= 1 j — m^\ 

] = rriy m-\~\y •• • ， / z ， i 己 


Ej = {C k \S k j < e, <);C ; |5J ^ e} 


(5.4. 34) 


这样定义的尽 ( j = m , m + 1， …，； O 是互不相容的，而且 


P { maxCj 

m^j^a 


— EO 


> e 


令 


^ P\ maxC ; 15；I ^ e = ^P(£ 7 ) (5‘4, 35) 


1， o>e e ; . 

^ (w) — < _ j = m f m + l^^ f n (5* 4. 36) 

( o , co e A 

n 

即 l 是馬的示性函数，注意到尽的互不相容性及 I ]& C = D , 

j=m 

因而 

n 

<1 (5.4-37) 

j 二 m 

所以有 

n 

£?> (5.4.38) 

j^m 

对 / 

5* — -5^ -f- (^ +1 — E$ J+l ) + + ($ k — E$ k ) 

因此 


E{SIX J )=E{S)X J ) 


擊 
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+£{[( f +1 — £6 +1 ) + … +(^—£6)] 2 • 

+ 2 五⑸ [% + 1 —從川） + … + ( 心一£匕）] . 

> EiSjXj ) + 2£ { [(^ +1 -£^ +1 ) + 

…+ ( ^ — E$m ) ]} (5.4.39) 


由于《5义只与6，…，（有关，因此与 [( f m — 泣 7+1 ) +…+ ( 芒 * — 
£匕)]独立，故 

五 / +1 —£U + … + (& — £$*)]} 

= E(SW 五 [% +1 — 莰 >+1 ) +… + ( 心一£6*)] = 0 

(5. 4. 40) 

而在 A 上■，故有 

r 

2 2 

EiS %) > ^EXj = ^ 2 P ( Ej ) (5*4.41) 

因此由 （5, 4. 39) ， （5. 4. 40) 及 （5. 4. 41) 得到 

E ( SlXj ) > < n (5.4.42) 


现在当 m ^ j <： n 时，由 （5. 4. 32) 知 

n— 1 

五 （ 71) = — (;u + ClEiSlXj) 

k — m 


n 一 1 

> ^ECSlXj)(Cl - CU,) + ClEiSlXj) 

k= i 



n-\ 


2 (ci 


k 


- ci +1 > + a 


= e z P { E 3 ) (5.4.43) 

由 （5.4_ 38) 及 （5. 4, 43) 

a 

Er )^^ P { E } ) (5.4.44) 

j—m 

利用 （5. 4. 33),(5. 4. 35) 及 (5. 4. 44) 即得不等式 (5. 4. 31). 

在噶依克一瑞尼不等式中，特别令 m = l，Q = l , 则得到著名 
的科尔莫戈罗夫不等式. 
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科尔莫戈罗夫不等式设$，匕… ，匕是 独立随机变量，方差 
有限，则对任意 e >0, 成立 


尸丨 max 

] 




£ f ) 


n 


>£ <^ 2 ^ ( 5 . 4 . 45 ) 


科尔莫戈罗夫不等式是概率论中最重要的不等式之一，有广 
泛的应用.在上式中，若令 n = l , 細得到 


F{|fi 


E^i I ^ ^ 




这正是车贝晓夫不等式.因此科尔莫戈罗夫不等式是车贝晓夫不 
等式的推广，而噶依克一瑞尼不等式又是科尔莫戈罗夫不等式的 
推广. 

利用噶依克一瑞尼不等式，能证明下面重要结果. 

定理 S. 4. 3( 科尔莫戈罗夫强大数定律）设{(}，/= 1 ， 2,… 

OQ 

是独立随机变量序列，且 S 4< oo , 则成立 

1 n 

Pjlim 七容 d = 0 卜 1 (5.4. 46) 


[证明]在噶依克一瑞尼不等式中，令(： 7 =岑，可以得到 


PI max 


丄 — 從) 




/ 


m 


n 


I ■ i - 

£ 2 


m 


2汉 



S 


> e 

D$, 


# 71+1 


由概率的连续性 


P {sup 


- £() 




limP max 


n 


m^ j^. n 


- 2 - eo 


>e 




e 


m 


j r ■ 


s 




(5.4. 47) 


m — 1 


_ 
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因为一 ^ 〈 ° 0 ，故由 （ 5* 4, 47 ) 得到 

尸 1 J 

limPjsup 4 2 (€ ― ED ^ e) = 0 

m I j>m J 1 J 

这正等价于 (5. 4. 46). 定理证毕 . 

科尔莫戈罗夫强大数定律的另外两种常见的证明方法见习题 
51 〜 55. 

显然，由科尔莫戈罗夫强大数定律很容易推出博雷尔强大数 
定律 . 

四、独立同分布场合的强大数定律 

在这种特殊的场合，可以找到强大数定律成立的充要条件，这 
个结果也属于科尔莫戈罗夫 . 

定理 5. 4 . 4( 科尔莫戈罗夫）设…是相互独立相同分 
布的随机变量序列，则 

—(^i + 芒 2 + …+ O - ► a (5. 4. 48) 

n 

成立的充要条件是存在且等于 a. 

[ 证明 ] 若 f 的分布函数为 F(x) ， 我们来证明不 等式： 

⑴ oa 

1 n —1 

(5.4,49) 

事实上， 

E\$\ = \x\dF(x) = Y) \x\dF(x) 

J — 。 々 =o 」 ui<*+i 

因此 

I 芒 I <A+ 1}<£|^| 

k=0 

CO 

< 2( 々 +1 輝 < 旧 < 々 +1) 


* 
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现在有 

OO oo 

^ kP { k ^ 旧 < & + 1 } = ifi <々 + u 

k— 0 1 k = n 

= 泣 {|U 

n— 1 

及 


+ l)P{k< |^t <是 + 1} 


k 


= 5>尸{是< 旧 <々 + 1} + 1 = 2 尸 < I 芒 I 彡 M + 1 

k =0 n= l 

这就证得了 （5. 4. 49). 这个不等式说明 £： KI < oo 的充要备件为 


2尸 { I 令 I > n } < oo 

n=\ 

记& =匕+6 +…+ 匕 ，若这里"是有限数，则 

TI 

U —! LZLi . 4二0 (5.4.50) 

n n n n 一 1 

这样一来，事件 { I 乞 I }发生无穷多次的概率为0，因此注意到^ 

的独立性,并利用博雷尔一康特立引理 ( ii ) ,可知 


夭 I >”}< oo 

n=l 

再由 （5. 4. 49) 即知 五 16 |<°°，这时显然有 <2 =從，这样，我们已 
证得必要性. 

下证充分性.用“截尾法”，令 


$* 
、 n 


安 n ， I I <n 

0， I 匕丨> ” 


(5.4.51) 


先验证 { f ： } 满足科尔莫戈罗夫强大数定律条件.以 FCr ) 记 f 的 
分布函数，则 


D ^； < E ^； 


n 


dF ( x ) < ^ k 2 P{k - l <\ t \< k ) 


镰 
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由于 

故 

因此 

因为 



= xdF(r) 

J —rt 

n 

显然 = 因此 lim 丄 由于 

03 n^-oc Tl i — i 

72 ( h ) < (^-^) 

i — 1 j 5 = 1 

+ (^- E^n +| 丄 2 ( E$r - a ) (5*4.53) 

n , = i n T~i 

it 

为证 （ 5 . 4 _48) 成立，只须再证丄 H m 、 =0. 然而 

ft J = 1 

oq oo 

2p{e= 2p(iei ^t}< : E\$ l \<^ 

* = i i=i 

由博雷尔一康特立引理知，以概率1有 

^( co ) ^ e ； (oO ,只对有限个成立 

因此 


4 
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P lim — 2 = 0 J = 1 

In n / =] J 

这样，定理的证明已经完成. 

显然，科尔莫戈罗夫的这个结果是辛钦大数定律的加强，只 
有它才能保证在每次试验中当 n — …时，子样的均值将最 

I = 1 

终地趋于母体的均值；当然从逻辑上讲也有可能失败，但是这种 
不愉快场合发生的概率等于 0. 用蒙特卡洛方法计算积分所需要 
的正是强大数定律. 


# §5. 中心极限定理 

— 、林德贝格条件与费勒 （ Feller ) 条件 

本节将最后解决古典的中心极限定理.为此先把问题的提法 
作进一步明确. 

古典的中心极限定理讨论的是独立和的分布函数向正态分布 
收敛的最普遍条件.这个问题一方面可以看作是棣莫弗一拉普拉 
斯古典结果的一般化，另一方面也解释了正态分布为什么是最常 
见的一种分布. 

自从高斯指出测量误差脤从正态分布之后，人们发现，正态 
分布在自然界中极为常见.例如炮弹的弹落点服从正态分布，人 
的许多生理特征如身长、体重等也服从正态分布.观察表明，如 
果一个量是由大量相互独立的随机因素的影响所造成，而每一个 
别因素在总影响中所起的作用不很大，则这种量通常都服从或近 
似服从正态分布. 

另外，在数理统计中，经常都假定母体眼从正态分布，这也 
要求通过对中心极限定理的研究来阐明这个假定的正确性和适用 
条件. 

现在，这个间题从某种意义上来讲已经得到了最后解决 .1922 
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年林德贝格提出了充分 条件； 1935年，费勒进一步指出，在某种 
条件下，这个条件也是必要的.这样就搞清了向正态分布收敛的 
充要条件.下面就介绍这些条件. 

设6…，…是一个相互独立的随机变量序列，它们具 
有有限的数学期望和 方差： 

a k = E^ kJ b\ = D^ k {k = 1,2, 

记 

Bl = pH 

作和数 

(5.5.1) 

我们需要寻找 和数匕 的分布函数趋于正态分布函数的充要条件. 

与独立同分布场合比较，这里保留了独立性的假定，但是去 
掉了同分布的要求.今后我们将以记乞的分布函数.显然 
为了 讨论匕 的极限分布，要使问题的提法有意义，对各个加项必 
须有一定 要求. 例如若允许从第二项起都等于0,则极限分布显然 
由 A (: r ) 完全确定，这时就很难有什么有意思的结果.排除这个 
困难的办法是规定加项中不能有某些项起支配作用，在实际工作 
中人们就是这样处理的，例如为了讨论测量的随机误差，总预先 
把一些系统性的误差先扣除掉. 

为了使极限分布是正态分布，还要求各个加项“均匀地小”， 
怎样明确表达这个要求呢？下面先作一个启发性的推导. 

设表示下述 事件： 

{I ^ ~ ^ J } (是=1，2,…，”） 

则有 

P{max 1 6* — a k \ > vB „) = P ( U (|^* -- a *| > r £„)} 

u 

- p { a x u 為 u … u 戌} < y . pu ,) 
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S 


dF k (x) 


k--\ J a k [>rH n 




(成） 


^ % 

s 




(x — a k ) 2 dF k (x) 


n 


,2 


r 4 

Z^j 






(x -- a k ) 2 dF k (jo) 


n 


因此，只要对于任何 r >0, 成立 


i-i S 


\JC- a k \>rB 


(•r - a k ) 2 dF k (x) 




0 


(5. 5. 2) 


n 


就可以保证总和 （5. 5. 1) 中各加项“均匀地小”.上述条件 (5. 5. 2) 
称为林 德贝格条件. 林德贝格证明了条件 (5. 5. 2) 是和数 (5. 5* 1) 
的分布函数趋于正态分布函数的充分条件. 

但是林德贝格条件不是中心极限定理成立的必要条件（参看 
习题 58). 不过，费勒进一步指出，假如下面条件得到 满足： 


1 * bk 

Iim max — 

n k^_n -On 


0 


(5. 5. 3) 


则林德贝格条件也是中心极限定理成立的必要条件. 


条件 （5. 5. 3) 称 为费勒条件. 下面考察一下费勒条件的含义. 
定理 S _ 5. 1 费勒条件 （5. 5. 3) 等价于 


\irnB 


n 


(5 - 5. 4) 


lim 


K 


0 


(5.5. 5) 


b k 


[证明]若 （5.5-3) 成立，则由貧 <max ¥立刻得到 




(5.5.5); 又若 H (朽< ⑻） ，不妨 假定& >0, 则因 max 

备，故 【 irnm^x 鲁 >0 ， 这与 (5,5,3) 矛盾，因此应有 


(5. 5. 4). 


反之，设 （5.5.4) (5.5. 5) 成立 • 对任意 e >0, 存在 正整数 
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M ， 使# < e 对一切 々> M 成立. 固定 M 之后，由于（5.5*4)，可 
以选一个正整数使 max ><£，下证对一切〃>以均有 

k<M £S 


TV 

bk 〆 

max - 5 - <C e 

t> n 


(5.5.6) 


事实上，利用坟的单调不减性，对一切 n > N > M 有 


max#<max^<e 


“一备 < max . 〈 e 

M<k^n ti n M<k^n L>k 


max 


因此 （5.5.6) 成立，这就证得了（5.5.3)，定理证毕. 

量#可以看作是分量&对总和 C 的贡献，因此费勒条件相 
t> n 

当 于说： 总和是大量“可忽略的”分量之和. 

下面我们转入证明主要定理. 

二、林德贝格一费勒定理 


为了不打断主要定理的证明，我们把在定理证明中要用到的 
若干事实，以引理的形式给出. 


引理 5. 5. 1对 n = l ， 2 ，…及任意的？， 


- 1 - 


it 

TT 


(itr 


-1 


0 — 1 )! 






(5. 5 - 7) 


[证明]记 

gniO 

先设 00 ,由于 


e 


U 




1 — 


IT 


(it) 


0 — 1 )! 


gi(0 






e lJ dr 


(5.5,8) 


因此 I 幻⑴ \< t , 其次，对; 2>1 


gn(t) 


g n ^ x ( x)dx 


(5. 5. 9) 
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用归纳法即得 （5.5.7). 

由于1仏(0丨=|片„(0|，因此（5.5. 7) 对也成立 •£ = () 结 
论 M 然成立. 

特别地，我们要用到 


— 1 — i , ^ 



e J/ - 1 


— if ~ f - 


t 2 





类似地可以得到，对00 


(5-5.10) 
(5. 5- 11) 


1 — cosi = 


sinxdjc 

0 


rt 


siaz |dr ^ 


xdx = 

0 



(5. 5. 12) 

这式两边都是 £ 的偶函数，故显然对£<0也成立. 

引理 5.5. 2对于任何满足 U* |<1 及 |6* |<1 (々 = l，2， w ， 
«) 的复数，有 


n 


“1“ 2 … — b x b z *^b n I < 2 l a > ~ ^ I (5. 5. 13) 


k 


[证明]显然 

a x a z —— b x b 


(a x — b x )a 2 + (a 


b z )b 


因此 


^ 1^2 — ^ 1^2 I ^ I — 办 1 I + 1“2 — 


用归纳法即得 (5.5.13) 

引理 5. S. 3 若 pOO 是特征函数，则 e 〜 m 也是特征函数，特 


别地 


n < 1 (5.5.14) 

[证明]定义随机变量 

7 — + …+ 么 

其中…相互独立，均^特征函数 〆 0, v 服从参数 A=1 的 
泊松分布，且与诸 f 独立，不难验证7的特征函数为 e^- 1 , 由特 
征函数的性质即知 (5.5.14) 成立. 
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现在叙述并证明主要的结果， 

定理 5. 5. 2 对 （5.5.1) 中定义的和数匕，成立 




—1 

兀」 

T 

e 

~ tZ/2 dt 

(5.5,15) 

与费勒条件〔5 

.5.3) 的充要条件是林德贝格条件 

(5. 5. 2) 成立 • 

[证明] 

为书写方便起见，我们引用记号 



^nk = 

二 a k 



(5. 5.16) 

显然 

— Of 

D^ nk — 

f : 

b \ 

-- 

Bl 

(5. 5. 17) 


2 ^"* - 

k =\ 


1 

(5. 5. 18) 


以 fMR (: r ) 分别表示^的特征函数与分布函数，那么 


( x ) = P J ^ Uk <C x j = F k ( B„x + a *) (5.5.19) 

这时 


r 




s-a k \>vB n 


(工— a k YdF k ( x ) 






n 


X 




B 


dF k ( x ) 


r 




y 2 dF nk ( y ) 


因此林德贝格条件 （5.5.2) 化为： 对任意 r >0. 


n 




jc 2 dF n L(x) = 0 




U 1 


现在开始证明定理.设 f 是任意固定的实数. 
为证 （5.5.15) 必须证明 


/»1 ⑴…九⑴ 


—► 


一々2 


(5.5* 20) 


(5. 5. 21) 


我们先证明，在费勒条件 （ L 5.3) 成立的假定下， （5. 5. 21) 与 


• 314 • 



下式是等价的 


n 


1](A,(0 — l) + > 


(5.5, 22 ) 


=1 


事实上，若 （5.5.3) 成立，是对任意 e >0, 只要 n 充分大， 


均有 




1，2,…，” 


另一方面，由 （5.5.10) 可知存在复数 I 使得 


XtJC 


— 1 — i^x 




因此 


fnkCO — \ 


dt 2 




再由 （5. 5, 17) 可得: 


\fnk(t) — 1 


dt 2 


x 2 dF nk { x ) 


(5.5. 23) 


< 


x 2 dF nk { x ) 


t 2 b\ 

2 Bl 


<i ^re 2 t 2 


(5.5. 24) 


对任意 5>0, 只要 kl 充分小，就可以有 

| e : — 1 — z | <^| z | (5.5*25) 

因此由引理 5.5.3、 引理 5.5.2 及（5.5.24)、（5.5.25)，只要” 

充分大，就有 ^ 

° — /„ i ⑴…九00 

n 

< 1 —兌⑴丨 

1 


n 




k 


n 


< T ^ 2 S 


k 


i Bl 


8t 2 


(5.5.26) 
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因为 3 可以任意小，故左边趋于0，因此证得 （5.5.21) 与 
(5.5.22) 的等价性. 

接着证明定理的充 分性. 先证由林德贝格条件可以推出费勒 
条件.事实上， 


B 


x 2 dF nk (x) 






x | 


x z dF nk (x) 4 - 




m/ 


kl>r 


jo 2 dF nk (x) 


n 






x 2 dF nk (x) 




|jt|> 


(5.5. 27) 


右边与 A 无关，而且 r 可选得任意地小；对选定的 r , 由林德贝格 
条件 （5. 5. 20) 知道第二式当 n 足够太时也可任意 地小. 这样，费 
勒条件成立. 

其次证明林德贝格条件能保证 (5. 5. 15) 成立.注意到 (5. 5.17) 
及 （5. 5. 18), 可知 


n 


2 [九⑴ 一 i ] + 釦 2 


k 


71 




k 


\.70 


e 


Ux 


—1 — itx + 


t 2 x 


dF nk (x) 


利用 （5.5. 11)， 当 k|<r 时， 


e 


Ux 


1 — ita: 



t z a: 2 


< 


tx 


3 / r|f 1 3 x 
- ^ ; ~ 


又利用（5.5.10)，当匕|>^时， 


e 


itx 


— 1 — i(x + 


t 2 x 2 




e 


Ifx 




1 — itx 



t 2 x 2 


^ t 2 x 


因此 


n 


^Lfnk(t) — 1 ] + 


n 


<S 








ihM dFnk(x 


n 


) 



s 




m 


t 2 x 2 dF nk (x) 


U!>r 
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n 


S 


rt 




z dF nk ( x ) + 


x 2 dF nk ( x ) 


w 


+， 2 S 






x 2 dF nk ( x ) 


(5, 5. 28) 


x 


对任给 e >0, 由于 r 的任意性，可选得使¥<"|，对选定的 r ， 
用林德贝格条件知只要》充分大，也可使 U ) 

<|,因此我们已证得了 （5.5.22), 但由于我们已证过费勒条件 

(5.5.3) 成立，这时 （5. 5.22) 与 （5.5.21) 是等价的，因而 
(5.5.21) 也成立，根据特征函数连续性定理可知 （5. 5.15) 成立. 
再证定理的必要性. 

由于 (5. 5.15) 成立，因此相应的特征函数应满足 (5. 5. 21) .但 
在费勒条件成立时，这又推出 （5. 5. 22)，因此 




S [/.(，)-!] + 


2 


/v 


e ifr -l + 


dF nk (x)-^0 


(5.5*29) 


t 


因为由 （5.5.12) 可得 cosk — 1 + ^>0,因此上述被积函数的实 


部是非负的，故 


n 


Re S 


1 w 




i- 


f 一 1 + 


t 2 x 2 




/ 


rm 

S 

k^l 






cosfx —1 + 


t 


dF ak (x) 




k=l 




1 j| >r 


costr —1 + 


t 




>2 


r* 


!^|>r 


i t 2 x 2 


dF nk (jo) 


n 


2 






U!>r 


a ' 2 dF ni ( x )~2 2 


产 




f ^ l > 


dF nk ( jc ) 
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x z dF nk ( x ) 

Jr\>r 


(5. 5* 30) 


因为对任意 r >0, 可找到，，使誓 一2 r - z >0, 这时由 （5.5.29), 

(5. 5.30) 可得 


" —— 2r 



x 2 dF nk (x)^0 


Ul>r 


故林德贝格条件成立，定理证毕. 


三、若干推论 


林德贝格条件给出了中心极限定理成立的普遍条件，由它可 
以推出许多特殊的结果. 

首先，我们来说明独立同分布场合的林德贝格一莱维定理是 
定理5_ 5. 2的特例. 

若6，匕，…是独立同分布随机变量序列， E ^ k = a , 0<<7 2 = 
汉*<°°，则 



由于方差 00 2 < oo ， 上式右边的积分当时趋于0，故林德 
贝格条件得到满足，所以中心极限定理成立. 

下面我们再来给出两个有用的结果. 

定理 5. 5.3 若 t ,彡 2 ，…是独立随机变量序列，存在常数 

使 max|H<iC„ (n=lf 2 ,…)，且 lim 备 = 0 ，贝 ！| 

1<X#I n^oolJ n 





3JS. 



[证明]由假定，对任意的 e >0, 只要《充分大就有 2 /C 


eB ” 显然 


— \ ^2 K n ^ 




1 , 2 , 


4 « # 


n 


因此 




1 ■ ，■国 




(5.5. 33) 


所以 


n 


lim _2 


y-i 




{jc — ajydFjix) 


ft 


n 


lim 02 XI 

n-^ y D n ■ j 




(x — ajydFj ( jt ) =1 


因此林德贝格条件得到满足，所以中心极限定理成立. 

定理 S . 5. 4 (李雅普诺夫）如果对相互独立的随机变量序列 


彡1，芒2， 


* •曾 


， 爸 汽， 




能选择这样一个正数 谷>0, 使当^00时， 


n 


Bl 


2 +戌 


2五 




2 +及 


0 


(5.5. 34) 


则 


n 


d—A) <x 






e 


- r/2 


di 


[证明]只要验证林德贝格条件就行了.事实上, 


B 


S 


n 




( x — a k ydF k ( x ) 


n 






Bl ( rB n ) 


2 


•/ 


U-a k l>rB rj 


\^ c — a k \ 2 ^ s dF k ( x ) 






\ x — a h | 2+ Mi ^( x )-^0 oo ) 


一 i J — ⑴ 


用定理 5. 5. 2 就可推得所需的结论. 

第五章小结 


本章研究了极限定理，这是概率论基础中比较深入的 结果； 前 
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/ L 章学到的知识在这里得到了综合 应用； 一 些重要问题在这里进 

一 步讨论并获得解决. 

在我们的课程中，为了使读者对极限定理有直观的认识，是 
从伯努利试验场合开始叙述的.这里所用的工具比较 初等： 伯努 
利大数定律是用矩法证明的；棣莫弗一拉普拉斯定理则通过利用 
斯特灵公式进行漸近估计而得到 • 

接着我们处理独立同分布场合，这是伯努利试验的直接推广, 
也是在实际中，特别是数理统计中，最常碰到的情况 • 为了证明 
辛钦大数定律及林德贝格一莱维定理已用到特征函数，所用的方 
法具有普遍性及簡明性，是读者比较容易理解的.应当指出，收 
敛性概念及特征函数这一工具是深入研究极限定理所不可缺少 
的，所以对这部分内容我们作了相当详细的叙述.后面用到的主 
要是结论，因此有关证明在初学时不妨略去. 

最后，介绍了强大数定律及一般场合的中心极限定理，这是 
概率论中相当深刻的结果.前者的证明通过建立比车贝晓夫不等 
式更为锐利的不等式而实现；后者的 i 正明则得力于特征函数这一 
有力的工具的巧妙应用.到此为止，概丰论尹提出的古典极限定 
理问題已获得了令人满意的解决. 

纵览整个发展过程，令人印象深刻的是，经典问題的最终解 
决，主要靠工具的改进，从直接展开，到矩法，再到特征函 数法; 
也靠方法的精密化，例如从车贝晚夫不等式，到马尔可夫不等式， 
再到科尔莫戈罗夫等更精细的不等式. 


习題五 

1. ^为非负随机变量，若 £ e af < oo ，（ a >0), 则对任意 _ r >0, 尸 

^e~ cx Ee a( . 

2. 若为随机变量，且 E / KGCco , 则关于任何 C ：>0, 尸 { AG ) 
>C}<C _1 £/i(e). 


*3. (单边车贝晓夫不等式）设6为随机变量 ，杈 = 0，仅=^<00,则 



对任何一个 ti >0， 试证 

4. {&} 各 以+概 率取值 F 和一 K ， 试证当■时，大数定律可用于 
独立随机变量序列… ，匕， …的算术平 均值. 


V^lnk 

5. 若^的分布列为 1 


变量序列％}. 


ylnk 

,，试证大数定律适用于独立随机 




6_验证概率分布如下给定的独立随机变量序列是否满足马尔可夫 条件: 

(1) Y ； 

( 2 ) / — 


(3) P{ ； G= 士々 } = — +，/MA = 0} = l —厂 1 

7. 若乞具 有有限方差，服从同一分布，但各 iM 司，厶和匕 +1 有相关，而 

U (\ k - l \^ 2 ) 是独立的，证明这时对{色}大数定律成立. 

8* (伯恩斯坦定理）已知随机变量序列 l ， s 2 , …的方差有界： 

并且当 I / —oo 吋，相关系数~—0,证明对 {U 成立大数定律. 

*9. (格涅坚科定理）对随机变量序列⑹，若记 V ” 二+ (匕+…+匕）， 

r (* 


a „ = ~ (從—…+從丄则 {$} 服从大数定律的充要条件是 

n 


lim£ 


( Vn ~^ n ) 2 

1 + ( VD 2 



10, 用斯特林公式 证明： 当? 1 — 00 ， oo , M-m— oo , 而时， 


(In 

\ n — m i 



11 •用 （5. 1*27) 计算 6 (5; 500， 0*01) 及 6 (40； 10000, 0.005) 并 
与精确值比较. 

12. 某计算机系统有120个终端，每个终端有5%时间在使用，若各个终 
端使用与否是相互独立的，试求有 K ) 个或更多终端在使用的概率 • 

*13- 求证，在: r >0 时，有不等式 
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]x : - e 

14. 用棣莫弗一拉普拉斯定理证明，在伯努利试验中 . 苦 0</><1 ，则 

不管 k 是如何大的常数，总有 

P{ \/z n — np\<K}-*0 oo) 

15. 用车贝晓夫不等式确定当掷一均匀铜币时，需投多少次才能保证使 
得正面出现的频率在 0. 4至 0* 6之间的概率不小于90%，并用正态逼近计 
算同一问题. 

16- 用车贝晓夫不等式及棟莫弗一拉普拉斯极限定理估计 r 面 概率： 

并进行比较.这里/4是《次伯努利试验中成功总次数，/>为每次成功的概率. 

17. 现有一大批种子，其中良种占1/6,今在其中任选6000粒，试问在 
这些种子中良种所占的比例与〗/6之差小于1%的概率是多少？ 

18. 种子中良种占1/6,我们有99%的把握断定在6000粒种 f 中良种所 
占的比例与1/6之差是多少？这时相应的良种粒数落在哪个范围内. 

19. 蒲丰试验中掷铜币4040次，出正面2048次，试计算当重复蒲丰试 
验时，正面出现的频率与概率之差的偏离程度不大于蒲丰试验中所发生的偏 
差的概率. 

*20. 设分布函数列弱收敛于连续的分布函数 F (: r)， 试证这收敛 
对 xGR 1 是一致的. 

*21. 设为一列正态分布函数，收敛于分布函数 FCr)， 试证 FG 0 
也是正态分布函数. 

•22 .试证若正态随机变量序列依概率收敛，则其数学期望与方差也收敛. 
*23. 若尤为多维正态随机向量，试证 X为正态向量 • 

0 n 、 

24. 若;^的概率分布为 1 1 ，试 i 正相应的分布函数列收敛，似 

1 -— — 

L n n J 

矩不收敛. 

* 25 , 随机变量序列{氕丨择有分布函数列（厂 （ x )}， 旦 F „ U 卜义 
{ 依概率收敛于常数 r > o , 试证： （ i)l = 己十％的分布函数收敛 r 

厂 Cr — (:) ; (2)〔=鲁 1 的分布闹数收敛于厂 ((>). 

7 ^ 
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16. 试证 ： （1) ^ X -> X h ~ X -^0； 

(2) X n ^ X ， X rt {X = Y } =h 

/ > p 

(3) X n — X => X „ — Xm —0 ( tt ， mr ~^ °° ); 

(4) X n ^ X ，L 士尺二 X 士 

(5) X n ^ X , 々是常数 

(6) X n ^ X^Xl ^ X 2 ； 

(7) X n : a ， y « 二 A ， a ，6 是常数 => x rt y „ 二 

(8) x n 厶 m 1 二 i ; 

(9) X 二 a ， Y 二 b ， a ， 6 是常数， ^0=> X „ Y 7 l 
〔10) X n ^ X ，Y 是随机变量二 XY ; 

( 11 ) xAx ， Y f1 ^Y^X n Y n ^XY. 

27. 设兄^二又，而贫是 R 1 上的连续函数，试证 g (足）二 g ( X )_ 

28. 若{足}是单调下降的正随机变量序列，且 X ,二0,试证； 0. 

29. 若…是独立随机变量序列，//是整值随机变量， ZM // 二 *}= 
外，見与{足}独立，求产不+毛十…十;^的特征函数， 

30. 若 /( t ) 是非负定函数，试证：（1)/(0)是实的，且 /(0)>0;(2 )/(D 

= 7 O );(3)|/( OK /(0). - 

31. 用特征函数法直接证明棣莫弗拉普拉斯积分极限定理. 

32. 若飞机乘客购票后按期搭机的概率为心各乘客的行动假定是独立 
的，试问一架200座飞机售出202张机票不发生超座的概率。对/>二 0.99, 
0.98， 0.97, 0. 96, 0. 95,计算上述概率 - 

33. 若母体 f 的数学期望 i ^= m ， Dh 、 抽容量为《的子样求其 f 均 
值？， 为使尸 {|? - m |<0. 1< t } >95%,问； i 应取多大值？ 

34•若{匕，《=1，2,… } 为相互独立随机变量序列，具有相同分布 

尸 { 芒 "=1 } = j ， r{^=o} 

n 

ffa 7 ^ S 试证％的分布收敛于 [ o , i ] 上的均匀 分布， 
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35. 用特征函数法证明二项分布的泊松逼近定理. 

36. 用特征函数法证明，泊松分布当时，渐近正态分布. 
•37 .若彳 U 是独立同分布随机变量序列，其分布分别为： （1) 

[—“ a ] 上均匀 分布； （2) 泊松 分布； （3) r 分布，记 




( m ) 



1:肌 



试计算的特征函数，并求 oo 时的极限. 

. 38 .设 { X „) 独立同分布，尸 { X n = 2*~ 21ni } =2-* (是 =1,2, …），则大数 

定律成立. 

*39 •若{ X ,}是相互独立的随机变量序列，均服从 W (0，1), 试证 
vur = ^7 兄 + … +孓 n Ti = Xl+ " ,+X " 

YV n y ri V2 I i V2 ^ ^ ^ / --- 

兄十…+；«：„ …+义 

渐近正态分布 AK 0,1)_ 

•40. 设 X 2 , …是独立随机变量序列，均服从 [0, 1] 均匀分布，令 


n 


MIW 



试证乙二 C ， 这里 C 是常数，并求 C . 

•41 •若 { X }是独立同分布随机变量序列， EX t = m , 若/ Cr ) 是一个 


有界的连续函数，试证 


lim £ 


A + … + x ” 






U 2 .若{ X ,}是独立同分布、具有有限二阶矩的随机变量序列，试证 


n (w + 1) 


2 iX t ^ EX x 


•43. 设不， X 2 , …相互独立，均服从柯西分布/> Or ) =+ • 试 


证它们不满足格涅坚科关于大数定律的充要条件（见本章习题9)，即要指 
出，当 n — 00 时 
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*44. (维尔斯特拉斯定理的概率论证明）设/ (1) 是[0, 1] h 连续 
函数，利用概率论方法 证明： 必存在多项式序列{凡 U )}， 在[0, 1] 上- 
致收敛于/&)，（提 示： 定义伯恩斯坦多项式 

m — 0 \ ffl / 


并利用大数定律. ） 


45•设{ X ,}是独立随机变量序列，试证义„-0的充要条件为对任意 


e>0 , 有 尸 (1XJ>£} <oo_ 

w 1 

46. 试证独立同分布随机变量序列，若存在有限的四阶中心矩，则强大 
数定律成立. 

47. 习题6的各个独立随机变量序列是否满足强大数定律？ 

48. 举例说明博 雷尔- 康特立引理 （ i ) 之逆不成立. 

49. 设 { XJ 是相互独立且具有有限方差的随机变量序列，若 


2 


DX 


< 


则必有 


h 2 DX 

ri ( 我 rt r 


0 


簧 


50, 设 / Cr ) 和 g ( x ) 在闭区间1:0, 1] 上连续，且满足 0</ Cr )< X > 


( t ) ，这里 C 是一个正常数，则成立 


lim 


OJ 0 


J 


/ Cr ]) + fix :) 



* ■ * 


+ fUJ 


《 Oi ) + g ( x 2 ) + + g (^ n ^> 




1 . 

f{a)&x 

Jo_ 

— n 

g{j )dx 

J 

**51. 直接证明科尔莫戈罗夫不等式. 

**52. 对事件序列及整数序列1 =〜<〜<♦••, 证明 t 

OO OO ~+厂 1 

( 1 ) n u n u * u a „； 

k - \k - k k = [j k n- 7}j 

(2) 若 XI 尸 n 九 }< m , 则 

, n — a n^- 

) ■ 

(3) 对随机变量序列若级敔 
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{ max I ^ I > e } 

对一切 £>0 收敛，则 P {^ 0 } =L 

• # 53 •若是独立随机变量序列，方差有限，记 


乂 = 2(。- £ 匕)， V ，七& 

>=-J 

(1) 利用科尔莫戈罗夫 不等式 证明： 

p^ = P{max\^\ >e ， 2" <» < 2 OT+1 } 


< 



(2) 对上述/>„，证明若 < Too ， 


则收敛; 


(3) 利用上题结果证明对彳乞}成立科尔莫戈罗夫强大数定律. 
54. (1) 设 { o } 为常数列，令 



1>， 



b m ^ sup{ }s m ^ k — 5 m ，々 =1 ， 2，，“} 

h ^ inf {6 w ，m = 1，2，"-} 


试证收敛的充要条件是心= <) ； 

i=l 


CO N 

(2) ( Kronecker 引理）对实数列 { c 山若 2] 令收敛，则 + 0. 

*:-1 e n *-i 

•*55.若{&}是独立随机变量序列，方差有限，记 

*=1 

(1) 利用科尔莛戈罗夫不等式证明 


+ n 


P { max \ S t 


m-\- k 


— I > ^ ^ 


m +1 


f 


OTj 

(2) 利用上题结论 (1) 证 明：若 l ]^< oo , 则义 以概率 1 收敛 * 

*=1 K 

(3) 利用 Kronecker 引理导出科尔莫戈罗夫强大数定律. 

56. 设 X 2 , …是独立随机变量序列，对它成立中心极限定理，则对 
{ XJ 成立大数定律的充要条件为 D ^ +…+又 ） =o (« 2 ). 


ft 

57. m x , X z , …是独立同分布随机变量序列，且4=对每一个 《 = 1 ，2, 


326 * 



…有相同分布，那么， 若 EX ，=0, DX f ^U 则兄必 须是 iV (0, 1) 变量. 

58•设{ X ,}是独立随机变量序列，且 X * 服从 N (0, 2^), 试证序列 
U 山 （1) 成立中心极限定理； （2) 不满足费勒条件； （3) 不满足林德 U 1 格 
条件，从而说明林德贝格条件并不是中心极限定理成立的必要条件， 

59•若( X ,)是独立随机变量序列，兄服从[一 1， 1] 均勻分布，对 
是= 2, 3,…，服从 W (0, 2*- 1 )，证明对{ X ,}成立中心极限定理但不满 

足费勒条件. 

*60. 在泊松试验中，第/次试验时事件 A 出现的概率为 A , 不出现的概率 
为…， 各次试验是独立的，以 h 记前次试验中事件4出现的次数. 试证: 


( 1 ) 



(2) 对成立中心极限定理的充要条件是 


61•设 { X k ] 是独立随机变量序列，厶服从[ — 々，々]均匀分布，问对 
{ X t } 能否用中心极限定理？ 

62-试问对下列独立随机变量序列，李雅普诺夫定理是否成立？ 


(1) X ,： 




m 


(2) X ,： 


/ 


k a 0 k a 
[ 1 1 




3 


， a>0. 


j 


祷 


63. 求证: 


时 


r 


n 忪 





2_ 




T-'e-Ydz 


/2 k 




zn 


da 


w 


64. 设 y >0, 独立随机变量序列{乞}，对一切 h 匕以概率^■分别取值士 


k 、 试利用中心极限定理 证明： 当时，大数定律不成立。（参看习题 4) 


櫞 


65-求证: 


增， 

Jt-o _ 



全书小结 


本书从大量重复试验中事件出现频率的稳定性这一经验事实 
出发，引进了一系列概念，建立了既有广泛实际应用又有深刻理 
论结果的--整套数学理论；最后这个理论又令人信服地解释了作 
为出发点的经验事实，到此为止，这个课程已告一段落. 

读者可以看到，作为概率论研究对象的随机现象，在自然界 
和人类社会中是普遍存在的，这既 说明了 概率论理论的重要性，也 
决定了它的应用的广泛性. 

读者也可以看到，概率论是数学的一个有特色的分支.一方 
面，由于它与其他数学分支（它们都研究决定性现象）研究对象 
的不同，因此它有着别开生面的研究课题，从而也有着自己独特 
的概念与方法.另一方面，它又是一个严谨的数学分支，它的概 
念有明确的定义，它的方法是严格的，它的结果是深刻的，这是 
许多著名数学家长期努力的结果，也得益于不断地从其他数学分 
支吸取有用的概念与方法. 

把概率论最基本的概念 一- 事件，概率，随机变量与数学期 
望分别看作是集合，规范化测度，可测函数与可测函数关于规范 
化测度的积分，这种观点自从概率论的公理化结构体系出现之后， 
已被普遍接受.这里强调的是概率论的测度论特点，对于概率论 
基本概念的明确定义是至关重要的. 

读者应当认识到，上述观点的形成是一个历史过程，同时也 
不应当忘记这些概念的现实背景，这时研究几个经典的模型是很 
有帮助的.历史上，古典概型、几何概率、伯努利概型等几个模 
型孕育了早期的概率论，对后来的发展也有重大影响.即使在今 
天，这些既直观又具体的模型也还值得我们特别注意. 
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统计独立性是概率论中特有的概念，它的引进大大丰富了概 
率论的研究.概率论基础中最深入的结果大都是在独立性的假定 
下获得的，这主要是指几种形式的极限 定理： 大数定律、强大数 
定律与中心极限定理. 

条件概率是另--重要概念，它使我们能充分利用有关的信息， 
在概率计算中十分有用.当进一步研究非独立的场合时，条件概 
率将起更大的作用. 

随机变量概念的普遍使用相对来讲还是近代的事，但是这个 
概念是很自然的，又便于运算，用它来描述事件有不少好处.涉 
及随机变量的最重要问题中大多数可以通过分布函数来表述，概 
率论的这一部分可以独立于它的测度论基础而进行，这里所用的 
主要是分析方法. 


数学期望是概率论中最古老的概念，它的明确的直观含意和 
良好的数学性质使它在概率论中一直占据着重要的地位，各种重 
要的数字特征大都是某种数学期望，甚至概率也是一种数学期望. 
数学期望，以及与它相辅相成的方差，刻画了随机变量的概貌，是 
实际应用中最关心的两个量. 

极限定理是概率论中最重要的理论结果，本书通过三个层次 
介绍了经典结果，相当详尽.分布函数、矩和特征函数这三者是 


解决古典极限定理的主要工具. 


总的说来，本书通过经典模型来提供有关背景，采用公理化 
结构以明确定义概念，强调独立性以突出学科的特点，利用分析 
方法来获得深刻的结果，最后也是最重要的一点是，试图通过大 
量的实例来介绍概率论的日益广泛的应用. 

正如本书的书名所指出的，这些知识仅仅是概率论的基础，它 
们是新的研究的出发点. 
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